Intel AI Lab открыла библиотеку обработки языка для диалоговых систем

Новости Отредактировано

Библиотека поддерживает работу с фреймворками машинного обучения Intel Nervana™ graph, Intel neon, TensorFlow, Dynet и Keras.

1К открытий1К показов

Intel AI Lab открыла исходный код библиотеки для обработки естественного языка, основанной на наборе моделей глубинного обучения. Библиотека создана для совершенствования чат-ботов и виртуальных помощников. Например, она учит распознавать категории объектов, понимать намерения пользователя и то, каких он ждёт действий.

Код библиотеки написан на языке Python и распространяется под лицензией Apache 2.0. Она поддерживает работу с фреймворками машинного обучения Intel Nervana™ graph, Intel neon, TensorFlow, Dynet и Keras.

Состав

В NLP Architect входят:

набор базовых моделей NLP для обработки информации на естественном языке;
модули NLU для распознавание смысла информации на естественном языке;
модули для семантического разбора;
компоненты для создания диалоговых систем с элементами искусственного интеллекта, таких как чат-боты;
шаблоны для построения готовых сервисов и примеры приложений с реализацией отвечающих на вопросы автоинформаторов, систем машинного чтения и интерфейсов для визуализации взаимосвязи между словами.

Intel AI Lab открыла библиотеку обработки языка для диалоговых систем 1

Задачи

По словам разработчиков, NLP Architect будет полезна:

в тренировках моделей с использованием предоставляемых алгоритмов, эталонных наборов данных и собственных данных;
при создании новых доступных моделей и расширении существующих;
в исследованиях применимости моделей глубинного машинного обучения для решения задач обработки информации на естественном языке;
в оптимизации алгоритмов машинного обучения;
для интеграции в проекты готовых модулей и утилит, предоставляемых библиотекой.

Модели библиотек NLP и NLU пригодны для разбора зависимостей между языковыми конструкциями, определения смысловых примитивов и маркировки слотов, применения сетей памяти для построения диалогов, применения сетей ключ/значение для организации взаимодействия в форме вопрос/ответ, использования моделей векторов для расстановки слов.

NLP и NLU используются при проведении семантической сегментации словосочетаний, выделении терминов, определении смысловой информации и разбивке текста на структурные элементы.

Модели обработки естественного языка

В библиотеке реализовали набор моделей глубинного обучения, ориентированных на работу с естественной речью. Функции не фокусируются на выполнении задач определенной специфики, но Intel думает над вариантами.

Некоторые инструменты в библиотеке созданы на наборах, обычно используемых в исследовательских кругах для тестов производительности. Она также обучает модели с помощью пользовательских данных или открытых баз, разработанных на основе TensorFlow от Google или PyTorch от Facebook.

С библиотекой Intel AI Lab разработчики смогут загружать тренировочные наборы, обучать на них нейросеть Intel. После — запускать тренировку самостоятельно вне языковой библиотеки и использовать модель в качестве входных данных приложения.

Разработка диалогового искусственного интеллекта с помощью ряда крупных компаний сейчас поставлена на поток. Создавать собственных голосовых ассистентов помогает Watson Assistant от IBM. С Яндекс.Диалогами можно создавать собственные навыки для «Алисы». Также компании разрабатывают виртуальных помощников для врачей и композиторов.

1К открытий1К показов

Также рекомендуем

$72 млн на смерти: как стартап Empathy превратил ее в продукт

В статье — история о том, как израильский стартап помогает людям справляться с утратой близкого человека и философские цитаты СЕО компании.

Какие языки умрут из-за ИИ: чистка Википедии и Инкубатор

Эти ошибки попали в обучение нейросетей, и от этого их стало ещё больше — вплоть до того, что гренландский раздел Википедии пришлось закрыть.

Илон Маск объявил войну Википедии и запустил Grokipedia. Обещает «очистить интернет от пропаганды

Илон Маск запустил Grokipedia — ИИ-энциклопедию на базе Grok, пообещав «очистить интернет от пропаганды» и превзойти Википедию

ИИ-сайты массово генерируют фейк-обнаженку из фото с соцсетей. Как защититься?

ИИ-сайты создают фейковую обнаженку из обычных фото из соцсетей. Как работают nudify-сервисы, почему их сложно закрыть и как защитить свои изображения от ИИ-генерации