Автор библиотеки для распознавания объектов от Google привел интересные примеры

Как сообщает Google Research Blog, Пит Уорден, программист компании Google, с гордостью сообщает о выходе TensorFlow — написанной на С++ открытой библиотеки с машинным обучением, способной распознавать объекты на исходном изображении. Созданию предшествовали годы исследовательской работы, а воплотить идею в жизнь Питу помогли его коллеги.

Библиотека использует для работы нейронные сети, которые дают гораздо более точный результат, чем любой код без их применения. Главная ее особенность — возможность машинного обучения, а уникальна TensorFlow тем, что охватывает весь жизненный цикл модели машинного обучения, и практика это подтверждает. При работе с плохо освещенным изображением количество ошибок составляет около 5,6%, но его можно уменьшить, если объединить 4 заранее обученных модуля в один — вместе они допускают 3,5% ошибок.

Впрочем, не обходится и без забавных особенностей. Например, в исходном коде не заложен отдельный класс для распознавания человека, и на портрете Линкольна библиотека в первую очередь замечает галстук-бабочку.

Исходники программы и подробную инструкцию по применению можно найти в репозитории на Github.