OpenAI научила роборуку собирать кубик Рубика на весу

Команда OpenAI научила роборуку на весу собирать кубик Рубика. С самыми сложными конфигурациями — теми, что требуют 26 поворотов, — она справляется в 20 % случаев. Если надо сделать 15 поворотов, количество успешных сборок возрастает до 60 %.

Обучали устройство вначале в виртуальной среде. Разработчики сделали много-много копий роборуки, все они учились параллельно. Как только копия приспосабливалась к одним условиям, виртуальная среда менялась.

После этого алгоритм перенесли в реальную роборуку и воспроизвели некоторые внешние факторы. Например, во время сборки кубик накрывали полотенцем, обсыпали конфетти и мелкими предметами, в него тыкали ручкой, другой роборукой и даже плюшевым жирафом. Робот даже умудрился выполнить задачу в резиновой перчатке.

Призы для программистов — нужно пройти опрос. Больше ответов — больше шансы

Source: N+1

Level UP для айтишников