Google выпустила новый API для распознавания объектов при помощи TensorFlow

TensorFlow

Google выпустила TensorFlow Object Detection API, предназначенный для распознавания объектов на изображениях. Инструмент получился одновременно простым и мощным, и он уже хорошо зарекомендовал себя в бенчмарках.

Что может новый API?

Среди моделей, добавленных в API, есть как мощные свёрточные нейронные сети, так и оптимизированные, предназначенные для работы на менее производительных машинах, например, недавно представленные MobileNets.

Пример работы одной из моделей

Современные смартфоны не обладают мощными вычислительными ресурсами по сравнению с настольными или серверными решениями. Поэтому у разработчиков есть два варианта. Первый — располагать модели машинного обучения в облаке, но это приводит к задержкам и требует подключения к Интернету. Второй подход — упрощать сами модели, делая ставку на массовое распространение.

Google, Facebook и Apple вкладывают немалые ресурсы в эти мобильные модели. Прошлой осенью Facebook выпустила фреймворк Caffe2Go для использования машинного обучения в режиме реального времени. Этой весной на I/O 2017 Google представила TensorFlow Lite, мобильную версию своего фреймворка. А на WWDC 2017 Apple показала CoreML, позволяющий встроить модели машинного обучения в приложение.

TensorFlow Object Detection API уже доступен, найти его можно на GitHub.

Источник: TechCrunch