Искусственный интеллект научили ориентироваться в Нью-Йорке

Компания Facebook обучила ИИ ориентированию, используя виртуальные изображения Нью-Йорка и диалоги людей в программе Talk The Walk.

Сотрудники отделения исследований искусственного интеллекта в Facebook (FAIR) создали программу Talk The Walk, которая научила компьютер ориентированию.

Цель программы

Специалисты компании считают, что ИИ сможет быть полезен в повседневной жизни, лишь когда полностью научится понимать человеческий язык. Для этого требуется обучение в жизненных ситуациях, а не тренировки ИИ на большом количестве текстовых данных. Talk The Walk была создана, чтобы понять, на сколько коммуникация, восприятие и действия могут повлиять на обучение машины человеческому языку.

Процесс обучения

5 районов Нью-Йорка (Адская кухня, Ист-Виллидж, Финансовый район и верхний Ист-Сайд, а также Вильямсбург в Бруклине) сняли на камеру с углом обзора 360°. Затем создали двух агентов ИИ: «туриста» и «гида», задав пункт назначения в виртуальных районах.

«Туристу» предстояло обрабатывать изображения и передавать «гиду» информацию о том, что видит первый. У «гида» в качестве информации была только 2D-карта с метками (например, «ресторан» или «бар»). Похожую задачу давали людям, в ходе которой с помощью сервиса Amazon Mechanical Turk записали более 10 тыс. диалогов успешного выполнения задания.

Искусственный интеллект научили ориентироваться в Нью-Йорке 1

Хотя ИИ обучался, используя эту базу данных, исследователи добавили вспомогательную возможность общения на машинном языке. Таким образом, «гид» и «турист» могли обмениваться исходными данными.

Выполнение задачи и результаты

ИИ определял местоположение при помощи технологии MASC (Masked Attention for Spatial Convolution). Она выбирала приоритетные ключевые слова из информации «гида», и «турист» лучше понимал, куда двигаться. Согласно исследованию, технология повысила эффективность поиска необходимой точки вдвое по сравнению с людьми (средним показателем были 44 действия и 8−9 реплик от каждого из участников). При этом, когда программа самостоятельно генерировала сообщения, а не использовала готовые фразы из диалогов, алгоритм выполнялся гораздо лучше.

Facebook — не единственная компания, которая предпринимает попытки обучить ИИ ориентированию. 4 июля 2018 года специалисты из DeepMind научили агентов играть в Quake III Arena, используя только картинку на экране и позитивный отклик при победе.

711 открытий711 показов

Также рекомендуем

9 картинок: угадайте промпты, по которым их нарисовал ИИ

Собрали для вас 9 интересных изображений, созданных нейросетью. Сможете угадать, по какому техническому заданию нарисованы эти картинки?

GOODY-2 — самый ответственный бот и главный по отмазкам среди нейросетей

Что бы вы у него ни спросили, Goody-2 найдет отмазку или уклонится от ответа. Даже если вы спросите, как дышать или почему щенки такие милые. Это тонкая сатира на ответы популярных Gemin и ChatGPT и, возможно, самый безопасный чат-бот.

30 известных и неизвестных ИИ для работы

В этой статье мы указали 30 инструментов на основе ИИ, которые улучшат вашу жизнь и значительно упростят работу.

YandexGPT научилась писать тексты и форматировать их

Нейросеть YandexGPT (YaLM 2.0) научилась создавать тексты, и процесс написания текстов можно видеть в режиме реального времени.