DeepMind запустила обучающий проект AlphaGo Teach

Команда DeepMind анонсировала веб-страницу, на которой показано, как AlphaGo играет в го.
AlphaGo Teach

Команда DeepMind представила веб-инструмент AlphaGo Teach. Он поможет начинающим и уже играющим в го найти новые и, может быть, нетривиальные стратегии ведения игры.

AlphaGo Teach

Этот инструмент базируется на анализе 6000 самых популярных последовательностей начала игры из недавней истории сыгранных партий го. Он также использует порядка 231 тысячи игр между игроками-людьми и 75 игр, проведённых между людьми и ИИ AlphaGo. На каждом этапе игры сравниваются вероятности выбора следующего хода ИИ и человеком.

AlphaGo Teach

Как использовать инструмент?

Каждый следующий возможный ход подсвечивается либо бирюзовым, либо фиолетовым. Первый — ход, который AlphaGo предпочёл бы в реальной игре, второй — предпочитаемый людьми. Цифры внутри кругов обозначают вероятный процент победы чёрных в партии и предсказываются AlphaGo. Когда ход чёрных, значение, близкое к 100, рассматривается как лучшее. Если ход белых, то более предпочтительны значения, близкие к 0. Значения, равные 50, означают, что исход игры будет ничейным.

Как понимать предсказанные значения?

Предпочтительный ход AlphaGo не всегда имеет самое высокое значение. Это связано с тем, что вероятность выигрыша каждого шага была рассчитана путём проведения независимого поиска 10 миллионов симуляций ходов от текущей позиции. AlphaGo имеет некоторую случайность в этом поиске. То есть, если мы снова запустим поиск, он может выбрать другое, но похожее значение. Подробнее узнать о работе ИИ AlphaGo можно в статье, опубликованной в журнале Nature.

Советуем также почитать наш материал о том, как AlphaGo Zero, прямой наследник AlphaGo, смог после всего лишь 40 дней самообучения победить своего предшественника.

Вячеслав Шарунов