Исследователи из Google DeepMind работают над ИИ с «воображением»

Новости

В DeepMind создали новый тип ИИ, имеющий аналог человеческого воображения и способный строить планы на ближайшее будущее в неидеальных средах.

643 открытий646 показов

Строить планы — это то, что хорошо получается у людей, но вот для ИИ это тяжёлая задача. Анализ данных и планирование будущего — вот навык, которому команда Google DeepMind хочет обучить ИИ. Недавно исследователи описали новые подходы, которые они разработали для внедрения «планирования на основе воображения» в ИИ.

Учёные создали так называемых «улучшенных воображением агентов» (imagination-augmented agent, или I2A), которые используют нейронную сеть, обученную извлекать из своего окружения любую информацию, которая может быть полезна при принятии дальнейших решений. Агент может создать план, оценить его и следовать ему. Прежде чем приступить к выполнению плана, он «представляет себе» последовательности действий и их последствий. Также ИИ может выбрать способ этого представления: работать ли ему с цепочками событий или же разбирать их по отдельности. В итоге алгоритм строит «дерево воображения», которое хранит в себе все воображаемые ситуации, в которых он мог бы оказаться на текущем шаге.

В DeepMind протестировали агента на игре-головоломке Sokoban и игре на космическом корабле, каждая из которых требует планирования и рассуждений. Обе задачи были выполнены им лучше, чем лишёнными воображения агентами.

Превью видео llwAwE7ItdM

Другие программы способны строить планы, но только в заранее ограниченных условиях. Как отмечают исследователи, AlphaGo неплохо с этим справляется. Однако такие среды, как игра го, можно считать «идеальными», ведь у них есть четко определенные правила, которые позволяют очень точно прогнозировать результаты. Но реальный мир не идеален, а правила в нем не однозначны, поэтому даже для агентов с самым сложным поведением такое планирование — очень сложная задача.

Следите за новыми постами
Следите за новыми постами по любимым темам
643 открытий646 показов