Google открыла доступ к самой большой базе мировых достопримечательностей Google-Landmarks

Датасет содержит более 2 миллионов записей для распознавания около 30 тысяч уникальных достопримечательностей по всему миру.

1 марта Google открыла доступ к большой базе данных для распознавания мировых памятников искусственного и природного происхождения. Набор «знаний» получил название Google-Landmarks и представлен в рамках соревнований от Kaggle на лучшие системы по распознаванию и поиску достопримечательностей.

Особенности Google-Landmarks

Набор данных содержит более 2 миллионов изображений, описывающих около 30 тысяч уникальных культурных памятников со всего мира. Количество классов, на которые разбиты картинки, примерно в тридцать раз больше, чем обычно используется в базах для распознавания.

распределение достопримечательностей из базы на карте мира Google-Landmarks

Вдобавок к этому, создатели Google-Landmarks открыли исходный код DELF — инструмента, определяющего и описывающего семантические локальные свойства, которые можно геометрически выразить между двумя изображениями одного объекта.

Соответствия в DELFСложная задача

По словам специалистов Google, распознавание достопримечательностей стоит особняком среди актуальных проблем машинного обучения. Например, даже такого большого набора данных недостаточно, чтобы описать множество менее известных памятников. Это связано с тем, что достопримечательности, как правило, представляют из себя неподвижные предметы, и их внутриклассовая вариация крайне мала. Это усложняет поиск ключевых особенностей распознаваемых объектов, так как их зачастую просто нет. Разнообразие можно воссоздавать искусственно, делая снимки памятника с различных ракурсов, однако такой подход ведёт к разрастанию баз данных. С подобной проблемой также приходится сталкиваться разработчикам систем распознавания произведений искусства.

Достопримечательности Google-Landmarks

Для решения этих проблем Kaggle устроила специальное соревнование, разделённое на две ветви. Участникам первого «челленджа» предстоит разработать модель, умеющую распознавать достопримечательность из предложенной базы, а их коллегам — создать систему, способную извлекать из набора данных все фотографии, на которых изображён требуемый памятник культуры.

Google принимает активное участие в развитии открытых проектов в области искусственного интеллекта. Напомним, что в середине февраля компания открыла доступ к базе серийных фотоснимков HDR+ в формате RAW, которую использует в собственной системе обработки изображений.

Источник: блог Google Research

Ещё интересное для вас:
Серверы для котиков: выберите лучшее решение для проекта и проверьте себя.
— Как расширить функциональность ПО на продакшене, ничего не сломав.
Сложный тест по C# — проверьте свои знания.