«Яндекс» представила NER, технологию распознавания имён, адресов и дат для «Алисы»

«Яндекс» представила технологию распознавания сущностей NER

Команда Яндекс.Диалогов разработала механизм распознавания именованных сущностей (NER, named-entity recognition), который можно подключить к любому из навыков для «Алисы». Это поможет виртуальной помощнице распознавать в тексте и речи имена, отсылки ко времени, адресам и числам.

NER для чат-ботов

Подробнее о NER

Именованные сущности — это все лексические конструкции, описывающие тот или иной объект. Команда «Яндекса» привела в пример ответы на простой вопрос «Алисы» о том, когда надо привезти пиццу:

  • завтра;
  • послезавтра в 9 утра;
  • послезавтра в 9 часов 40 минут;
  • через два часа;
  • 4 октября в 18 часов;
  • в 6 часов вечера.

Предусмотреть все подобные варианты — задача сложная, поэтому разработчики «Яндекса» разбили её на части и научили «Диалоги» распознавать:

  • имена — фамилию, имя, отчество, а также разделять имена разных людей;
  • местоположение — страну, город, улицу, номер дома, название аэропорта;
  • дата и время — абсолютные (5 октября 2018 года, 20:00) и относительные (послезавтра, через два часа);
  • числа — десятичные дроби и целые.

Технологию NER можно подключить к любому навыку «Алисы» через Яндекс.Диалоги. Платформа для создания чат-ботов вышла из беты в мае 2018 года, а до того два месяца провела в режиме тестирования.

Source: блог Яндекс.Диалогов