DeepMind научила нейросеть проходить видеоигры по роликам на YouTube

Тимур Кондратьев

Нейросеть DeepMind анализирует видео с YouTube с прохождением игр людьми, а затем запоминает эффективные шаги и применяет их на практике.

DeepMind, дочерняя компания Google, рассказала о новом методе обучения нейронных сетей прохождению видеоигр с консоли Atari. Для этого ИИ анализировал записи игр с YouTube и запоминал правильные тактики и ходы игрока.

Для чего?

В техническом документе разработчики объяснили, что нейросеть в общем случае плохо справляется с задачами, которые требуют навыков исследования и принятия решений. Традиционные машины заточены под определенные алгоритмы и ограничены рамками заложенных в них функций. Исследователи из DeepMind приводят в пример их предыдущую разработку — нейросеть AlphaGo, которая обучена играть в определенную игру — го — со строгими правилами.

В случае с видеоиграми, подразумевающими проверку правильных путей и выигрышных маршрутов, количество шагов для достижения цели вырастает экспоненциально с ростом количества вариантов. Разработчики говорят, что в игре Montezuma’s Revenge с Atari, на которой они тренировали нейросеть, прохождение первого уровня насчитывает около 100 «шагов», что подобно 10018 возможных действий.

Поэтому в DeepMind разработали новый метод обучения нейросетей специально для победы в такого рода видеоиграх.

В чем суть метода?

Новая техника основана на анализе видеороликов с YouTube с прохождением игр людьми. Нейросеть просматривает все шаги игрока, отсеивает лишние и неэффективные, а затем запоминает удачные и применяет их уже в своем прохождении:

Этот метод позволяет тренировать нейронную сеть, лишь однажды загрузив в нее несколько роликов с YouTube. Разработчики могут устанавливать цели, например пройти уровень быстрее или получить больше очков, тем самым обучая ИИ.

Что дальше?

Такая технология может быть полезной для обучения роботов работе в новых условиях без непосредственного присутствия их в этой среде. Например, машине, предназначенной для работы на Марсе, можно показать фрагменты съемки ландшафта или видео с условиями планеты прежде, чем отправлять ее туда.

Исследователи искусственного интеллекта часто пользуются видеоиграми для обучения нейросетей. Например, DeepMind обучала нейросеть многозадачности с помощью Quake, а ученые из университета Фрейбурга научили машину побеждать в игре Q*bert, используя баги.

2К открытий2К показов

Также рекомендуем

Обложка поста GPT-4 стала ленивее и тупее

GPT-4 стала ленивее и тупее

Пользователи GPT-4 пожаловались, что модель поначалу была медленной, но очень точной. Теперь GPT-4 стала быстрее, но глупее.

Обложка поста Вышла утилита, отключающая любую рекламу в Windows 11 в один клик

Вышла утилита, отключающая любую рекламу в Windows 11 в один клик

Девушка-разработчик под ником xM4ddy создала утилиту «Oh F*ck Go Back» (OFGB), позволяющую отключать все виды рекламы в Windows 11

Обложка поста BASIC исполнилось 60 лет: каким язык был десятки лет назад и чем живет сегодня

BASIC исполнилось 60 лет: каким язык был десятки лет назад и чем живет сегодня

Накануне легендарный язык программирования BASIC отметил свое 60-летие. Вспомнили, как зарождался инструмент и что с ним происходит сегодня

Обложка поста 🔥 Энтузиаст выяснил, почему в конце выражений большинства языков программирования используется «;»

🔥 Энтузиаст выяснил, почему в конце выражений большинства языков программирования используется «;»

Разработчик нового языка программирования Lilac выяснил, почему во многих других языках в качестве разделителя выражений используется именно точка с запятой