Написать пост

ABBYY представила SDK для распознавания текста в реальном времени

Аватар Вячеслав Шарунов

ABBYY представила новый SDK, отличительной чертой которого является использование ИИ для определения содержания изображений на 63 языках.

Компьютерное зрение очень быстро развилось за последние несколько лет. Начиная с приложений Word Lens и Google Goggles и заканчивая самой последней разработкой компании Google, Lens, возможность распознавать текст и объекты на любом устройстве в режиме реального времени стала чуть ли не жизненно необходимой.

Новый SDK от ABBYY

Компания ABBYY объявила о выпуске нового SDK для распознавания текста в режиме реального времени (Real-Time Recognition, RTR SDK). Впервые набор инструментов был представлен на конференции AI Europe 2017.

Превью видео 4KxRti1pWQk

Как он работает?

Используя потоковое видео смартфона, приложение с использованием SDK мгновенно захватывает и извлекает текст и данные из самых сложных документов и объектов: например, c паспорта, с пропуска на конференцию или с платёжных документов. Более того, набор инструментов может извлекать информацию на 63 языках. Это гораздо больше, чем умеет переводчик Google.

Благодаря распознаванию в режиме реального времени пользователи приложений cмогут легко вводить данные из печатных источников, документов и банковских карт. Другими словами, распознавание в режиме реального времени меняет в лучшую сторону взаимодействие между клиентом и брендом.

Где может быть применим?

Стопети также отметил, что любое приложение, для работы которого требуется ввод различных данных, может извлечь выгоду из быстрых, точных и лёгких распознавания и классификации текста.

Интегрированный в финансовые, страховые, логистические, коммерческие, потребительские или государственные приложения SDK значительно ускоряет сложные процессы идентификации и регистрации пользователей, такие как открытие счета, подача заявки на получение кредита или ввод информации о банковской карте, номера и серии паспорта или обычного промо-кода.

Важно отметить, что все действия по распознаванию SDK делает без каких-либо последствий для безопасности. Эта технология очень подходит для процессов, требующих соблюдения правил безопасности и конфиденциальности, поскольку никакие изображения не отправляются на сервер и не хранятся на устройстве.

Использование ИИ в новом SDK

Что касается использования ИИ, то Стопети сказал:

В данный момент времени мы работаем с нейронными сетями для улучшения качества распознавания. Мы также хотим использовать всю мощь, предоставляемую новыми чипами для работы с ИИ, такими как процессоры с поддержкой нейронных вычислений Apple A11 и HiSilicon Kirin 970, которые обеспечивают обучение прямо на устройстве. Это позволит постоянно улучшать ИИ нашего SDK на основе обратной связи пользователя.

Начало работы с SDK

Получить доступ к пробной версии SDK, а также изучить документацию можно на официальной странице продукта. Примеры использования и интеграции в приложения iOS и Android доступны в репозитории GitHub.

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов