DeepMind научили ИИ играть в Quake III Arena по-человечески

Name: DeepMind научили ИИ играть в Quake III Arena по-человечески
Uploaded: 2018-07-04T12:38:35.000Z
Description: ИИ играл как в одиночку, так и собираясь в команды с людьми. DeepMind научил агентов использовать различные тактики и ориентироваться на местности.

Новости

ИИ играл как в одиночку, так и собираясь в команды с людьми. DeepMind научил агентов использовать различные тактики и ориентироваться на местности.

1К открытий1К показов

Исследователи из DeepMind — подразделения Alphabet в сфере изучения ИИ — опубликовали в своем блоге запись об очередной разработке, призванной научить ИИ лучше играть в видеоигры. На этот раз специалисты видоизменили Quake III Arena и ее режим «Захват флага» и заставили агентов обучаться этой игре.

Подробнее об исследовании DeepMind

Авторы выбрали именно «Захват флага», чтобы ИИ самостоятельно обучился механикам игры в процедурно-генерируемом мире. Агенты играли как в одиночку, так и собираясь в команды, в том числе вместе с людьми. Кроме того, ИИ научился использовать такие тактики, как защита базы, ожидание противника и следование за напарником:

Разработчики использовали метод обучения с подкреплением, а ИИ не получал никакой дополнительной информации, кроме картинки на экране. Команда агентов обучалась с каждым матчем, получая позитивный отклик при победе. При этом у каждого из них была собственная внутренняя награда. ИИ основан на паре рекуррентных нейронных сетей, быстрой и медленной, каждая из которых изучает переход от набранных очков к внутренней награде.

По итогам исследования авторы обнаружили, что агенты ИИ не только выигрывали чаще, чем люди, но также были более сплоченными. Согласно полученным данным, у ИИ коэффициент Elo, отвечающий за шанс выигрыша, выше человеческого:

DeepMind научили ИИ играть в Quake III Arena по-человечески 2

Авторы утверждают, что в будущем будут развивать технологии одновременного обучения с подкреплением нескольких агентов ИИ, а также уделять большее внимание объединению агентов и людей в команды для большей эффективности. Более детальное описание разработки можно получить в техническом документе.

Это не первое исследование возможностей ИИ для победы в видеоиграх. Предыдущей работой команды DeepMind был ИИ, обученный проходить игры по роликам на YouTube.

1К открытий1К показов

Также рекомендуем

Система для Хекслета, релиз ChatGPT Omni и Джейло на репите: Ретроперспектива недели с Кириллом Мокевниным

В новом выпуске рубрики «Ретроперспектива недели» мы общаемся с Кириллом Мокевниным — автором тг-канала «Организованное программирование», разработчиком-преподавателем и сооснователем популярной онлайн-школы для разработчиков Хекслет.

Как новая нейросеть OpenAI повлияет на распространение фейков

Прокомментировала появление новой нейросети от OpenAI и оценила потенциальное увеличение фейковых новостей в связи с этим событием.

Альтернатива JetBrains: обзор GIGA IDE от Сбера

СберТех показал отечественную среду разработки GIGA IDE — рассказываем, что она из себя представляет и чем еще может быть полезным GitVerse.

Stack Overflow навсегда запретил ИИ-контент на сайте. Разбираемся, почему

Stack Overflow навсегда запретил публикацию контента, созданного с помощью ИИ, из-за частых ошибок в таких ответах. Решение принято после того, как платформа столкнулась с массовым потоком низкокачественного контента, который затруднял поиск достоверных ответов