Написать пост

Google представила хранилище Open Images V4 с размеченными объектами для систем компьютерного зрения

Аватар Екатерина Никитина

Open Images V4 содержит 9 млн изображений с очерченными границами объектов и метками к ним. 14,6 миллионов контуров предметов разделены на 600 категорий. В среднем на каждом изображении находится 8,4 объектов.

В своем блоге Google рассказала о большой открытой библиотеке Open Images V4, содержащей 9 млн изображений с очерченными границами объектов и метками к ним. 14,6 миллионов контуров предметов разделены на 600 категорий. В среднем на каждом изображении находится 8,4 объектов.

Структура Open Images V4

Хранилище содержит обучающий набор из 9 млн изображений, а также валидационный (41,6 тыс.) и тестовый (125,4 тыс.). На всех картинках проставлены метки и прямоугольные границы объектов. Метки из последних двух наборов (и часть из обучающего) прошли верификацию. В основном, проверку проводили специалисты из команды Google, но небольшую долю работы выполнили краудсорсеры из Image Labeler.

Open Images Challenge

Компания также объявила об Open Images Challenge — новом конкурсе среди моделей распознавания, который пройдет на конференции ECCV 2018 в сентябре. Системы распознавания должны брать за основу Open Images V4 и выполнять одну из двух задач:

  1. Определение класса объекта — предсказание жесткого прямоугольного контура для всех экземпляров из 500 классов.
  2. Определение визуальных связей — обнаружение связанных пар объектов, к примеру, «женщина, играющая на гитаре».

Для тех, кто хочет самостоятельно опробовать на практике возможности систем распознавания, Google разработала DIY-наборы (Do It Yourself). В апреле 2018 года компания выпустила усовершенствованные «коробки» Vision Kit и Voice Kit с упрощенной настройкой и новым «железом».

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов