Написать пост

DeepMind представила нейросеть AlphaZero, способную обучиться настольной игре с нуля за несколько часов

Аватар Екатерина Никитина

Алгоритм AlphaZero от DeepMind работает по принципу обучения с подкреплением. На вход подаются только правила игры, стратегию нейросеть разрабатывает сама.

Разработчики из компании DeepMind, принадлежащей Google, опубликовали статью об алгоритме AlphaZero, который работает по принципу обучения с подкреплением и способен за несколько часов самостоятельно обучиться любой настольной игре. В отличие от других алгоритмов такого рода, на вход AlphaZero подаются только правила игры, а стратегии нейросеть разрабатывает с нуля.

За сутки AlphaZero обогнала три нейросети, лучшие в своих категориях. После четырех часов обучения шахматам AlphaZero одержала победу над действующим чемпионом, алгоритмом Stockfish. Два часа японских шахмат сёги дали возможность AlphaZero обыграть алгоритм Elmo. Чтобы обойти в го знаменитую сеть AlphaGo, оказалось достаточно восьми часов.

Как отмечает The Verge, этот алгоритм приближает команду DeepMind к созданию универсального искусственного интеллекта, но применить его к разработке новых материалов или лекарств пока не представляется возможным. Всё-таки шахматы и го — это всего лишь настольные игры, тогда как наука предполагает решение проблем совсем иного уровня.

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов