Ученые из OpenAI создали алгоритм, который помогает роботам учиться на неудачном опыте

Name: Ученые из OpenAI создали алгоритм, который помогает роботам учиться на неудачном опыте
Uploaded: 2018-02-28T19:39:31.000Z
Description: Алгоритм, названный Hindsight Experience Replay, интерпретирует неудачи как своеобразные успехи. Такой подход ускоряет решение не только текущей задачи, но и расширяет спектр решаемых задач в целом.

Новости Отредактировано

Алгоритм, названный Hindsight Experience Replay, интерпретирует неудачи как своеобразные успехи. Такой подход ускоряет решение не только текущей задачи, но и расширяет спектр решаемых задач в целом.

1К открытий1К показов

Компания OpenAI, которая специализируется на исследованиях в области искусственного интеллекта, выпустила алгоритм с открытым исходным кодом — Hindsight Experience Replay (HER), который интерпретирует неудачи как успехи.

Различия в мышлении

Человек отличается от робота тем, что может учиться и на ошибках, и на победах. Мы узнаем, какие методы работают для достижения цели, а какие нет, а также накапливаем информацию о том, как потерпели неудачу, и можем применить эти знания в решении последующих задач.

Роботы могут использовать в обучении схожую технику проб и ошибок, где будут получать вознаграждения за любой результат, приближающий к цели.

Отличие Hindsight Experience Replay от других ИИ

Идея алгоритма Hindsight Experience Replay состоит в получении опыта в решении какой-то смежной задачи, если изначальная цель не была достигнута. Также ИИ учитывает и провалы, чтобы избежать повторных ошибок в будущем.

Каждое выполненное HER действие, даже если это неудача, воспринимается как частичный успех. Благодаря такому алгоритму задачи постоянно меняются в зависимости от полученного результата, а робот учится. В итоге первоначальные цели достигаются путем решения смежных задач.

Исследователи смоделировали робота, использующего данный алгоритм, и сравнили его с роботом без данной модификации:

1К открытий1К показов

Также рекомендуем

Глава OpenAI Сэм Альтман: «До появления ИИ-сверхразума осталось всего несколько тысяч дней»

Глава OpenAI Сэм Альтман заявил, что создание сверхразумного ИИ возможно уже через несколько тысяч дней. По его словам, искусственный интеллект откроет новые горизонты для человечества, изменив нашу жизнь до неузнаваемости

🔥 В мозговой чип встроили ChatGPT. И это сработало

Пока Илон Маск обещает внедрить свой мозговой чип от Neuralink тысячам людей, конкуренты не спят и внедряют ChatGPT в свой продукт

«Google — для бумеров»: молодежь массово переходит на ИИ-поиск информации в интернете

Молодёжь всё чаще обращается к ИИ-платформам, таким как ChatGPT и Perplexity, для поиска информации. Удобство и скорость получения точных ответов привлекают пользователей, оставляя Google позади

🔥 Разработчик с 10+ годами опыта назвал плюсы и минусы ИИ-помощников наподобие Copilot и Codeium

Опытный разработчик с более чем 10-летним стажем проанализировал плюсы и минусы ИИ-помощников, таких как GitHub Copilot и Codeium.