Google представила хранилище Open Images V4 с размеченными объектами для систем компьютерного зрения

Новости

Open Images V4 содержит 9 млн изображений с очерченными границами объектов и метками к ним. 14,6 миллионов контуров предметов разделены на 600 категорий. В среднем на каждом изображении находится 8,4 объектов.

2К открытий2К показов

В своем блоге Google рассказала о большой открытой библиотеке Open Images V4, содержащей 9 млн изображений с очерченными границами объектов и метками к ним. 14,6 миллионов контуров предметов разделены на 600 категорий. В среднем на каждом изображении находится 8,4 объектов.

Структура Open Images V4

Хранилище содержит обучающий набор из 9 млн изображений, а также валидационный (41,6 тыс.) и тестовый (125,4 тыс.). На всех картинках проставлены метки и прямоугольные границы объектов. Метки из последних двух наборов (и часть из обучающего) прошли верификацию. В основном, проверку проводили специалисты из команды Google, но небольшую долю работы выполнили краудсорсеры из Image Labeler.

Open Images Challenge

Компания также объявила об Open Images Challenge — новом конкурсе среди моделей распознавания, который пройдет на конференции ECCV 2018 в сентябре. Системы распознавания должны брать за основу Open Images V4 и выполнять одну из двух задач:

Определение класса объекта — предсказание жесткого прямоугольного контура для всех экземпляров из 500 классов.
Определение визуальных связей — обнаружение связанных пар объектов, к примеру, «женщина, играющая на гитаре».

Для тех, кто хочет самостоятельно опробовать на практике возможности систем распознавания, Google разработала DIY-наборы (Do It Yourself). В апреле 2018 года компания выпустила усовершенствованные «коробки» Vision Kit и Voice Kit с упрощенной настройкой и новым «железом».

2К открытий2К показов

Также рекомендуем

OpenAI и Anthropic объединились для создания открытых ИИ-агентов под эгидой Linux Foundation

OpenAI и Anthropic создали Agentic AI Foundation под Linux Foundation, объединив MCP, Goose и AGENTS.md в единый стандарт ИИ-агентов

OpenAI анонсировала функции ChatGPT, которые сделают поиск в Google бесполезным

ChatGPT получит визуальный поиск, интерактивные ответы и встроенные приложения, из-за которых привычный поиск Google может стать ненужным

Эволюция программиста 2005–2025: от CRT-мониторов до квантовых алгоритмов

Эпохи развития программирования в России и в мире. Какие стадии прошли разработчики и к чему пришли в настоящий момент. Прогнозы на будущее.

Хакер взломал Google и научился находить номера телефонов пользователей за 15 секунд

Хакер нашел уязвимость Google: взлом телефонов за 15 секунд. Атака через форму восстановления раскрывала номера пользователей