Искусственный интеллект научили ориентироваться в Нью-Йорке

Новости

Компания Facebook обучила ИИ ориентированию, используя виртуальные изображения Нью-Йорка и диалоги людей в программе Talk The Walk.

713 открытий717 показов

Сотрудники отделения исследований искусственного интеллекта в Facebook (FAIR) создали программу Talk The Walk, которая научила компьютер ориентированию.

Цель программы

Специалисты компании считают, что ИИ сможет быть полезен в повседневной жизни, лишь когда полностью научится понимать человеческий язык. Для этого требуется обучение в жизненных ситуациях, а не тренировки ИИ на большом количестве текстовых данных. Talk The Walk была создана, чтобы понять, на сколько коммуникация, восприятие и действия могут повлиять на обучение машины человеческому языку.

Процесс обучения

5 районов Нью-Йорка (Адская кухня, Ист-Виллидж, Финансовый район и верхний Ист-Сайд, а также Вильямсбург в Бруклине) сняли на камеру с углом обзора 360°. Затем создали двух агентов ИИ: «туриста» и «гида», задав пункт назначения в виртуальных районах.

«Туристу» предстояло обрабатывать изображения и передавать «гиду» информацию о том, что видит первый. У «гида» в качестве информации была только 2D-карта с метками (например, «ресторан» или «бар»). Похожую задачу давали людям, в ходе которой с помощью сервиса Amazon Mechanical Turk записали более 10 тыс. диалогов успешного выполнения задания.

Искусственный интеллект научили ориентироваться в Нью-Йорке 1

Хотя ИИ обучался, используя эту базу данных, исследователи добавили вспомогательную возможность общения на машинном языке. Таким образом, «гид» и «турист» могли обмениваться исходными данными.

Выполнение задачи и результаты

ИИ определял местоположение при помощи технологии MASC (Masked Attention for Spatial Convolution). Она выбирала приоритетные ключевые слова из информации «гида», и «турист» лучше понимал, куда двигаться. Согласно исследованию, технология повысила эффективность поиска необходимой точки вдвое по сравнению с людьми (средним показателем были 44 действия и 8−9 реплик от каждого из участников). При этом, когда программа самостоятельно генерировала сообщения, а не использовала готовые фразы из диалогов, алгоритм выполнялся гораздо лучше.

Facebook — не единственная компания, которая предпринимает попытки обучить ИИ ориентированию. 4 июля 2018 года специалисты из DeepMind научили агентов играть в Quake III Arena, используя только картинку на экране и позитивный отклик при победе.

713 открытий717 показов

Также рекомендуем

80% разработчиков потеряют актуальность навыков из-за ИИ к 2027 году

По данным Gartner, к 2027 году 80% разработчиков утратят актуальность своих навыков из-за внедрения генеративного ИИ. Специалистам необходимо повысить квалификацию и освоить новые технологии, чтобы сохранить конкурентоспособность на рынке

Искусственный интеллект на службе бизнеса: пути интеграции и преодоление барьеров

Искусственный интеллект (ИИ) в последние годы стал неотъемлемой частью бизнес-среды, предоставляя компаниям мощные инструменты для улучшения эффективности и производительности. На каких направлениях можно сделать акцент, чтобы успешнее внедрить ИИ, и на что обратить внимание при его интеграции в различные отделы?

Все нестабильно: что случилось с Unstable Diffusion и стоит ли она вашего внимания

Узнайте о Unstable Diffusion - мощном инструменте для генерации изображений без цензуры. Подробное руководство по регистрации, использованию, примеры генерации и отзывы пользователей. Читайте наш обзор и начните создавать уникальные изображения уже сегодня.

Обзор AI-ассистентов в написании кода: от ChatGPT до Copilot

Блогер Conner Ardman сделал обзор на 7 ИИ-ассистентов для пограммирования от ChatGPT и Bard до Copilot.