MIT портировал на JavaScript свою систему распознавания текста Tesseract

Новости Отредактировано

5К открытий5К показов

Портировав свою систему оптического распознавания текста Tesseract на JavaScript, разработчики из MIT существенно упростили процесс создания приложений для распознавания изображений.

Tesseract.js, выпущенная в этом месяце, включает в себя поддержку более 60 языков, автоматическую ориентацию текста и распознавание скриптов. Запускаемая в браузере или на сервере через Node.js, эта библиотека предоставляет простой интерфейс для чтения абзацев, слов и отдельных букв.

Разработчики посчитали, что портирование системы на JavaScript будет очень удобно пользователям, ведь с установкой версии на C++ могут возникнуть проблемы, а на некоторые конфигурации программа не установится вовсе. Преимущество JS-библиотеки заключается в том, что она может работать на любой системе с JS-интерпретатором.

Слой API сделан максимально простым в использовании. После добавления скрипта в проект достаточно написать:

			Tesseract.recognize(myImage).then(function (result) { console.log(result) })

Разработчики сообщают, что программа настроена для работы с документами, а не фотографиями. Для обработки фотографий рекомендуется повысить их контрастность, отмасштабировать размер и убрать фоновые шумы. Все эти функции скоро будут реализованы в самой библиотеке.

5К открытий5К показов

Также рекомендуем

Как TanStack Query ускоряет работу с API и сокращает код

Использование TanStack Query дает разработчикам возможность упростить работу с API, сократить дублирование кода и ускорить разработку. Рассказываем о проблемах, связанных с использованием API, и соответствующих решениях для повышения эффективности разработки.

SolidJS и Qwik: фронтенд нового поколения

Обзор SolidJS и Qwik — плюсы и минусы фреймворков. Сравнение SolidJS и Qwik, практические рекомендации по переходу и тенденция отказа от React/Vue.

Почему банки нанимают ученых для распознавания паспортов, а не open-source модели

Студент собирает распознавание паспортов за выходные, а банки платят миллионы за специальные решения. Разбираемся, почему бесплатные AI-модели не подходят для бизнеса и при чём здесь реальная наука

Как машины понимают речь. Часть 1

Сегодня одной фразы достаточно, чтобы техника сделала всё за нас. Но давно ли началось это «сегодня» и как вообще девайсы нас понимают? В первой части серии материалов «Как машины понимают речь» проследим историю этого явления.