Тут ребята применили обратный РЛ, чтобы узнать мотивации червей (не дождевых червей, а Caenorhabditis elegans). Ну то есть как обычно: награда -> стратегия, а тут посчитали что стратегия у этих червей и так оптимальная, поэтому интересно посмотреть что там за награды #reinforcementlearning
подоспел свежий фреймворк для #reinforcementlearning от фейсбука, типа очень гибкий и быстрый, позволяет запускать среды пачками и проч. https://github.com/facebookresearch/ELF
GitHub
GitHub - facebookresearch/ELF: An End-To-End, Lightweight and Flexible Platform for Game Research
An End-To-End, Lightweight and Flexible Platform for Game Research - facebookresearch/ELF