Google выпустила бета-версию API своих алгоритмов компьютерного зрения и открыла его для всех желающих

Теперь любой может отправить свои изображения в облачный сервис Google, чтобы получить информацию о том, что на них изображено — от обнаружения объектов повседневной жизни (например «автомобиль», «суши» или «орёл») до распознавания текста или логотипов известных брендов, сообщается в официальном блоге платформы.

С выпуском бета-версии Cloud Vision API, кроме отправки изображения вместе с запросом, стало доступно указание пути к изображениям в облачном хранилище Google. Кроме того, были представлены цены на пользование сервисом.

cloud-vision-2

Поддерживаются следующие сценарии работы:

  • Распознавание объектов на изображении. В основе те же алгоритмы, которые используются в поиске картинок Google.
  • Обнаружение неприемлемого контента.
  • Анализ эмоциональной окраски изображений. Сервис распознаёт на лицах людей радость, печаль, злость и некоторые другие эмоции.
  • Извлечение текстовой информации. Используется оптическое распознавание символов (OCR) вместе с автоматическим определением языка надписи.

cloud-vision-1

Во время тестового периода, Google будет ограничивать количество запросов к API 20 миллионами в месяц. В Google также отметили, что некоторые компании уже внедрили новый сервис в свои продукты и планируют использовать его и в дальнейшем.

На видео показан забавный пример применения Cloud Vision API: робот смотрит на объекты и произносит, что он перед собой видит.

Источник: блог Google Cloud