Ваши 5 минут — и Tproger станет лучше. Кликните по баннеру, чтобы пройти опрос.

DeepMind научила нейросеть проходить видеоигры по роликам на YouTube

Новости Отредактировано

Нейросеть DeepMind анализирует видео с YouTube с прохождением игр людьми, а затем запоминает эффективные шаги и применяет их на практике.

2К открытий3К показов

DeepMind, дочерняя компания Google, рассказала о новом методе обучения нейронных сетей прохождению видеоигр с консоли Atari. Для этого ИИ анализировал записи игр с YouTube и запоминал правильные тактики и ходы игрока.

Для чего?

В техническом документе разработчики объяснили, что нейросеть в общем случае плохо справляется с задачами, которые требуют навыков исследования и принятия решений. Традиционные машины заточены под определенные алгоритмы и ограничены рамками заложенных в них функций. Исследователи из DeepMind приводят в пример их предыдущую разработку — нейросеть AlphaGo, которая обучена играть в определенную игру — го — со строгими правилами.

В случае с видеоиграми, подразумевающими проверку правильных путей и выигрышных маршрутов, количество шагов для достижения цели вырастает экспоненциально с ростом количества вариантов. Разработчики говорят, что в игре Montezuma’s Revenge с Atari, на которой они тренировали нейросеть, прохождение первого уровня насчитывает около 100 «шагов», что подобно 10018 возможных действий.

Поэтому в DeepMind разработали новый метод обучения нейросетей специально для победы в такого рода видеоиграх.

В чем суть метода?

Новая техника основана на анализе видеороликов с YouTube с прохождением игр людьми. Нейросеть просматривает все шаги игрока, отсеивает лишние и неэффективные, а затем запоминает удачные и применяет их уже в своем прохождении:

Этот метод позволяет тренировать нейронную сеть, лишь однажды загрузив в нее несколько роликов с YouTube. Разработчики могут устанавливать цели, например пройти уровень быстрее или получить больше очков, тем самым обучая ИИ.

Что дальше?

Такая технология может быть полезной для обучения роботов работе в новых условиях без непосредственного присутствия их в этой среде. Например, машине, предназначенной для работы на Марсе, можно показать фрагменты съемки ландшафта или видео с условиями планеты прежде, чем отправлять ее туда.

Исследователи искусственного интеллекта часто пользуются видеоиграми для обучения нейросетей. Например, DeepMind обучала нейросеть многозадачности с помощью Quake, а ученые из университета Фрейбурга научили машину побеждать в игре Q*bert, используя баги.

2К открытий3К показов

Также рекомендуем

🔥 LinkedIn представил ИИ-замену HR-специалистам

🔥 LinkedIn представил ИИ-замену HR-специалистам

LinkedIn представил Hiring Assistant — ИИ-замену HR-специалистам, автоматизирующую задачи рекрутеров от создания описаний вакансий до поиска и взаимодействия с кандидатами

Обзор AI-ассистентов в написании кода: от ChatGPT до Copilot

Обзор AI-ассистентов в написании кода: от ChatGPT до Copilot

Блогер Conner Ardman сделал обзор на 7 ИИ-ассистентов для пограммирования от ChatGPT и Bard до Copilot.

🔥 OpenAI предрекли возможность банкротства в ближайшие 12 месяцев

🔥 OpenAI предрекли возможность банкротства в ближайшие 12 месяцев

Несмотря на сверхпопулярность ChatGPT, создатель сервиса, компания OpenAI, в ближайший год может столкнуться с финансовыми проблемами

Новый Zoom-плагин определяет deepfake в режиме реального времени

Новый Zoom-плагин определяет deepfake в режиме реального времени

Reality Defender представила новый плагин для Zoom, который в реальном времени обнаруживает deepfake-видео и защищает пользователей от фальшивых видеозвонков