Перетяжка, Премия ТПрогер, 13.11
Перетяжка, Премия ТПрогер, 13.11
Перетяжка, Премия ТПрогер, 13.11

Нейросеть от Deepmind осваивает правила любой игры за несколько часов самостоятельного обучения

Новости

Шахматы, го, игры Atari, Starcraft II, Quake 3 Arena — скоро у людей вообще не останется шансов победить нейронные сети.

2К открытий2К показов

В научном журнале Nature опубликовали статью с описанием последних достижений нейросети MuZero, развитием которой занимается компания Deepmind. Программа научилась одинаково хорошо играть в шахматы и компьютерные игры. При этом ей даже не пришлось объяснять правила. MuZero учится самостоятельно, просто наблюдая за ходом игры.

Нейросети от Deepmind стали известны миру в 2016 году, когда AlphaGo в 4 партиях из 5 победила одного из сильнейших игроков мира в го. Ранее эта китайская настольная игра считалась слишком сложной для компьютеров. Более мощная версия нейросети, AlphaZero, научилась совершенствоваться без участия человека. Программа играла сама с собой, осваивая одну игру за другой.

В алгоритме MuZero используется подход, аналогичный AlphaZero. Для обучения нейросеть играет сама с собой. Также её противником становилась программа AlphaZero. Всего за 12 часов тренировок и 800 млн игровых сессий MuZero достигла уровня AlphaZero в шахматах, го и других настольных играх, а также превзошла все существующие нейросети, кроме Agent57, при прохождении Pac-Man и других компьютерных игр.

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов