DeepMind представила нейросеть AlphaZero, способную обучиться настольной игре с нуля за несколько часов

AlphaZero уже обыграла нейросети-чемпионы по играм в го и шахматы.
AlphaZero DeepMind

Разработчики из компании DeepMind, принадлежащей Google, опубликовали статью об алгоритме AlphaZero, который работает по принципу обучения с подкреплением и способен за несколько часов самостоятельно обучиться любой настольной игре. В отличие от других алгоритмов такого рода, на вход AlphaZero подаются только правила игры, а стратегии нейросеть разрабатывает с нуля.

За сутки AlphaZero обогнала три нейросети, лучшие в своих категориях. После четырех часов обучения шахматам AlphaZero одержала победу над действующим чемпионом, алгоритмом Stockfish. Два часа японских шахмат сёги дали возможность AlphaZero обыграть алгоритм Elmo. Чтобы обойти в го знаменитую сеть AlphaGo, оказалось достаточно восьми часов.

Как отмечает The Verge, этот алгоритм приближает команду DeepMind к созданию универсального искусственного интеллекта, но применить его к разработке новых материалов или лекарств пока не представляется возможным. Всё-таки шахматы и го — это всего лишь настольные игры, тогда как наука предполагает решение проблем совсем иного уровня.

Источник: The Verge