Нейросеть от Deepmind осваивает правила любой игры за несколько часов самостоятельного обучения

Начала с шахмат и го, потом взялась за классику: игры Atari, Starcraft II, Quake 3 Arena, Pac-Man. Это уже не остановить.

В научном журнале Nature опубликовали статью с описанием последних достижений нейросети MuZero, развитием которой занимается компания Deepmind. Программа научилась одинаково хорошо играть в шахматы и компьютерные игры. При этом ей даже не пришлось объяснять правила. MuZero учится самостоятельно, просто наблюдая за ходом игры.

Нейросети от Deepmind стали известны миру в 2016 году, когда AlphaGo в 4 партиях из 5 победила одного из сильнейших игроков мира в го. Ранее эта китайская настольная игра считалась слишком сложной для компьютеров. Более мощная версия нейросети, AlphaZero, научилась совершенствоваться без участия человека. Программа играла сама с собой, осваивая одну игру за другой.

В алгоритме MuZero используется подход, аналогичный AlphaZero. Для обучения нейросеть играет сама с собой. Также её противником становилась программа AlphaZero. Всего за 12 часов тренировок и 800 млн игровых сессий MuZero достигла уровня AlphaZero в шахматах, го и других настольных играх, а также превзошла все существующие нейросети, кроме Agent57, при прохождении Pac-Man и других компьютерных игр.

Нейронные сетиПодписаться

2К открытий2К показов

Также рекомендуем

Какие нейросети раздевают людей — DeepNude 18+

Составили подборку из пяти нейросетей, которые раздевают людей на фотографиях. Рассказали, легально ли это.

От языковой модели до ассистента: как перестать бояться и полюбить обучение с подкреплением

Рассказал, как из простой языковой модели сделать полезного ассистента, соблюдающего законы робототехники.

Поиск контактных данных с помощью Yandex GPT 3 API

Совершенствуем модерацию — поиск контактов в файлах .pdf . / .docx с помощью новой версии нейронки Яндекса, причем полностью на демо-деньги.

Дайджест Python #8: обновления Django и обучение GPT-4

Собрали дайджест из материалов по Python с 15 по 30 апреля. Узнайте, как подключить AutoGPT проекту, как изменился Django и как обучить GPT-4.