Искусственный интеллект научился использовать для победы баги в игре

Нейронная сеть, созданная для игры в аркады, самостоятельно искала недочеты программы.
Нейронная сеть научилась находить выигрышные стратегии путем поиска багов в играх Atari

Исследователи из университета Фрейбурга обучали ИИ методом проб и ошибок, также известным как эволюционная стратегия. Такой подход, в отличие от обучения с подкреплением, позволяет развивать способы выполнения заданий, используя удачные техники и исключая нерабочие.

Нейронная сеть играла в восемь различных игр с консоли Atari, в том числе, в классическую аркаду Q*bert. В ней игрок должен управлять оранжевым персонажем в пирамиде и уклоняться от атак врагов.

Неожиданный подход

Вместо того, чтобы развивать навыки игры, как это делал бы человек, нейросеть придумала необычную выигрышную стратегию: она нашла баг в коде игры и воспользовалась им для получения игровых очков. Хитрость заключалась в том, что в определенное время ИИ совершил самоубийство персонажа, которое привело к прохождению уровня.

В результате

С одной стороны, эта нейронная сеть показала, как эволюционные подходы позволяют ИИ достичь успеха без вмешательства человека. Но с другой — исследователи должны помнить о необходимости ограничивать стратегии, которыми могут пользоваться нейросети для достижения результата.

Это не первый случай, когда машина научилась играть в видеоигру лучше человека. В 2017 году была создана нейросеть, обучающаяся на игре StarCraft по аналогичному методу проб и ошибок.

Источник: MIT Technology Review

Ещё интересное для вас:
Тест: какой язык программирования вам стоит выбрать для изучения?
Тест: как хорошо вы разбираетесь в Data Science?
Соревнования и бесплатная онлайн-школа для программистов