Google наделила ИИ инстинктом самосохранения

Роботов оснастили собственной «интуицией», которая позволила практически полностью исключить человека из процесса обучения ИИ.

Комплексные алгоритмы глубокого обучения уже умеют имитировать весьма сложные поведенческие навыки. Однако для полного освоения требуется их многократное повторение с сопутствующими перезагрузками среды обучения. Такие перезагрузки — задача нетривиальная, поэтому процесс обучения часто требует полноценного участия человека.

Команде Google Brain вместе с группами ученых из университета Кэмбриджа, института Макса Планка и Калифорнийского университета в Беркли удалось разработать новые алгоритмы, освобождающие людей от этой монотонной работы.

Роботизированная интуиция

Исследователями была предпринята попытка научить ИИ классифицировать все действия, поддающиеся перезагрузке, как безопасные. Это создало основу для разработки так называемых политик «форвард» и «ресет». Конкурирующие алгоритмы с успехом подсказывают ИИ, будет ли его следующее действие необратимым (например, лишний шаг приведёт к падению со скалы) и когда следует остановиться. Таким образом роботы набирают опыт, методом проб и ошибок «познавая» все больше действий, пригодных для обучения.

По прогнозам ученых, обучение машин планированию своих действий поможет существенно ускорить тестирование сложных алгоритмов в реальной жизни (например, автомобильных систем автопилотирования), а также повысить надежность и безопасность подобных экспериментов.

Хинт для программистов: если зарегистрируетесь на соревнования Huawei Honor Cup, бесплатно получите доступ к онлайн-школе для участников. Можно прокачаться по разным навыкам и выиграть призы в самом соревновании.

Перейти к регистрации

Источник: The Next Web