ABBYY представила SDK для распознавания текста в реальном времени

Новости Отредактировано

Отличительной чертой нового SDK является использование ИИ для распознавания текста на 63 языках.

2К открытий2К показов

Компьютерное зрение очень быстро развилось за последние несколько лет. Начиная с приложений Word Lens и Google Goggles и заканчивая самой последней разработкой компании Google, Lens, возможность распознавать текст и объекты на любом устройстве в режиме реального времени стала чуть ли не жизненно необходимой.

Новый SDK от ABBYY

Компания ABBYY объявила о выпуске нового SDK для распознавания текста в режиме реального времени (Real-Time Recognition, RTR SDK). Впервые набор инструментов был представлен на конференции AI Europe 2017.

Превью видео 4KxRti1pWQk

Как он работает?

Используя потоковое видео смартфона, приложение с использованием SDK мгновенно захватывает и извлекает текст и данные из самых сложных документов и объектов: например, c паспорта, с пропуска на конференцию или с платёжных документов. Более того, набор инструментов может извлекать информацию на 63 языках. Это гораздо больше, чем умеет переводчик Google.

Благодаря распознаванию в режиме реального времени пользователи приложений cмогут легко вводить данные из печатных источников, документов и банковских карт. Другими словами, распознавание в режиме реального времени меняет в лучшую сторону взаимодействие между клиентом и брендом.

Где может быть применим?

Стопети также отметил, что любое приложение, для работы которого требуется ввод различных данных, может извлечь выгоду из быстрых, точных и лёгких распознавания и классификации текста.

Интегрированный в финансовые, страховые, логистические, коммерческие, потребительские или государственные приложения SDK значительно ускоряет сложные процессы идентификации и регистрации пользователей, такие как открытие счета, подача заявки на получение кредита или ввод информации о банковской карте, номера и серии паспорта или обычного промо-кода.

Важно отметить, что все действия по распознаванию SDK делает без каких-либо последствий для безопасности. Эта технология очень подходит для процессов, требующих соблюдения правил безопасности и конфиденциальности, поскольку никакие изображения не отправляются на сервер и не хранятся на устройстве.

Использование ИИ в новом SDK

Что касается использования ИИ, то Стопети сказал:

В данный момент времени мы работаем с нейронными сетями для улучшения качества распознавания. Мы также хотим использовать всю мощь, предоставляемую новыми чипами для работы с ИИ, такими как процессоры с поддержкой нейронных вычислений Apple A11 и HiSilicon Kirin 970, которые обеспечивают обучение прямо на устройстве. Это позволит постоянно улучшать ИИ нашего SDK на основе обратной связи пользователя.

Начало работы с SDK

Получить доступ к пробной версии SDK, а также изучить документацию можно на официальной странице продукта. Примеры использования и интеграции в приложения iOS и Android доступны в репозитории GitHub.

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов