Ученые из OpenAI создали алгоритм, который помогает роботам учиться на неудачном опыте

Name: Ученые из OpenAI создали алгоритм, который помогает роботам учиться на неудачном опыте
Uploaded: 2018-02-28T19:39:31.000Z
Description: Алгоритм, названный Hindsight Experience Replay, интерпретирует неудачи как своеобразные успехи. Такой подход ускоряет решение не только текущей задачи, но и расширяет спектр решаемых задач в целом.

Варвара Белавина

Алгоритм, названный Hindsight Experience Replay, интерпретирует неудачи как своеобразные успехи. Такой подход ускоряет решение не только текущей задачи, но и расширяет спектр решаемых задач в целом.

Компания OpenAI, которая специализируется на исследованиях в области искусственного интеллекта, выпустила алгоритм с открытым исходным кодом — Hindsight Experience Replay (HER), который интерпретирует неудачи как успехи.

Различия в мышлении

Человек отличается от робота тем, что может учиться и на ошибках, и на победах. Мы узнаем, какие методы работают для достижения цели, а какие нет, а также накапливаем информацию о том, как потерпели неудачу, и можем применить эти знания в решении последующих задач.

Роботы могут использовать в обучении схожую технику проб и ошибок, где будут получать вознаграждения за любой результат, приближающий к цели.

Отличие Hindsight Experience Replay от других ИИ

Идея алгоритма Hindsight Experience Replay состоит в получении опыта в решении какой-то смежной задачи, если изначальная цель не была достигнута. Также ИИ учитывает и провалы, чтобы избежать повторных ошибок в будущем.

Каждое выполненное HER действие, даже если это неудача, воспринимается как частичный успех. Благодаря такому алгоритму задачи постоянно меняются в зависимости от полученного результата, а робот учится. В итоге первоначальные цели достигаются путем решения смежных задач.

Исследователи смоделировали робота, использующего данный алгоритм, и сравнили его с роботом без данной модификации:

1К открытий1К показов

Также рекомендуем

GPT-Migrate — ИИ-инструмент для миграции с одного языка или фреймворка на другой

GPT-Migrate — это нейросетевой инструмент, который позволяет быстрее переписать весь код с одного языка программирования на другой.

Яндекс выпустил YandexGPT — свой ChatGPT с блэкджеком и Алисой

Яндекс выпустил YandexGPT — модель, похожую по функциональности на ChatGPT. Об этом стало известно на конференции.

Вышло приложение ChatGPT для iOS

OpenAI запустила официальное приложение ChatGPT для iOS. Приложение использует ту же версию GPT, что и веб-версия.

Как стать топ-100 на Kaggle и топовым Data Scientist, за которым охотятся работодатели

Адель Валиуллин делится опытом участия в соревнованиях и рассказывает, как занять высокое место в рейтинге Kaggle.