Google представила хранилище Open Images V4 с размеченными объектами для систем компьютерного зрения
Новости
Open Images V4 содержит 9 млн изображений с очерченными границами объектов и метками к ним. 14,6 миллионов контуров предметов разделены на 600 категорий. В среднем на каждом изображении находится 8,4 объектов.
2К открытий2К показов
В своем блоге Google рассказала о большой открытой библиотеке Open Images V4, содержащей 9 млн изображений с очерченными границами объектов и метками к ним. 14,6 миллионов контуров предметов разделены на 600 категорий. В среднем на каждом изображении находится 8,4 объектов.
Структура Open Images V4
Хранилище содержит обучающий набор из 9 млн изображений, а также валидационный (41,6 тыс.) и тестовый (125,4 тыс.). На всех картинках проставлены метки и прямоугольные границы объектов. Метки из последних двух наборов (и часть из обучающего) прошли верификацию. В основном, проверку проводили специалисты из команды Google, но небольшую долю работы выполнили краудсорсеры из Image Labeler.
Open Images Challenge
Компания также объявила об Open Images Challenge — новом конкурсе среди моделей распознавания, который пройдет на конференции ECCV 2018 в сентябре. Системы распознавания должны брать за основу Open Images V4 и выполнять одну из двух задач:
- Определение класса объекта — предсказание жесткого прямоугольного контура для всех экземпляров из 500 классов.
- Определение визуальных связей — обнаружение связанных пар объектов, к примеру, «женщина, играющая на гитаре».
Для тех, кто хочет самостоятельно опробовать на практике возможности систем распознавания, Google разработала DIY-наборы (Do It Yourself). В апреле 2018 года компания выпустила усовершенствованные «коробки» Vision Kit и Voice Kit с упрощенной настройкой и новым «железом».
2К открытий2К показов