Google открыла доступ к самой большой базе мировых достопримечательностей Google-Landmarks

Новости

Датасет содержит более 2 миллионов записей для распознавания около 30 тысяч уникальных достопримечательностей по всему миру.

4К открытий4К показов

1 марта Google открыла доступ к большой базе данных для распознавания мировых памятников искусственного и природного происхождения. Набор «знаний» получил название Google-Landmarks и представлен в рамках соревнований от Kaggle на лучшие системы по распознаванию и поиску достопримечательностей.

Особенности Google-Landmarks

Набор данных содержит более 2 миллионов изображений, описывающих около 30 тысяч уникальных культурных памятников со всего мира. Количество классов, на которые разбиты картинки, примерно в тридцать раз больше, чем обычно используется в базах для распознавания.

Google открыла доступ к самой большой базе мировых достопримечательностей Google-Landmarks 1

Вдобавок к этому, создатели Google-Landmarks открыли исходный код DELF — инструмента, определяющего и описывающего семантические локальные свойства, которые можно геометрически выразить между двумя изображениями одного объекта.

Сложная задача

По словам специалистов Google, распознавание достопримечательностей стоит особняком среди актуальных проблем машинного обучения. Например, даже такого большого набора данных недостаточно, чтобы описать множество менее известных памятников. Это связано с тем, что достопримечательности, как правило, представляют из себя неподвижные предметы, и их внутриклассовая вариация крайне мала. Это усложняет поиск ключевых особенностей распознаваемых объектов, так как их зачастую просто нет. Разнообразие можно воссоздавать искусственно, делая снимки памятника с различных ракурсов, однако такой подход ведёт к разрастанию баз данных. С подобной проблемой также приходится сталкиваться разработчикам систем распознавания произведений искусства.

Google открыла доступ к самой большой базе мировых достопримечательностей Google-Landmarks 2

Для решения этих проблем Kaggle устроила специальное соревнование, разделённое на две ветви. Участникам первого «челленджа» предстоит разработать модель, умеющую распознавать достопримечательность из предложенной базы, а их коллегам — создать систему, способную извлекать из набора данных все фотографии, на которых изображён требуемый памятник культуры.

Google принимает активное участие в развитии открытых проектов в области искусственного интеллекта. Напомним, что в середине февраля компания открыла доступ к базе серийных фотоснимков HDR+ в формате RAW, которую использует в собственной системе обработки изображений.

4К открытий4К показов

Также рекомендуем

«Проект X» от мира IT: вечеринка Cluely собрала 2000 человек и была остановлена полицией

Вечеринка стартапа Cluely после YC AI School собрала 2000 человек, но была остановлена полицией из-за хаоса. «Проект X» из мира IT

Национальный мессенджер Max: что умеет и чего от него ждать

Разбираем вместе с экспертами, как работает Max: функции, интеграции с Госуслугами, вопросы безопасности и перспективы развития сервиса.

5 open-source моделей, в которые можно вписаться до конца 2025 года — Qwen, Gemma, DeepSeek, Mistral, OpenAI

Open-source ИИ набирает обороты: запускайте Qwen, Gemma, DeepSeek, Mistral и GPT-OSS на обычном ноуте и создавайте рабочие прототипы

🔥 Для Chrome вышло расширение, пускающее в соцсети лишь после выкрика: «Я — лузер!»

Новое расширение для Chrome пускает в соцсети только после громкого крика: «Я — лузер!». Эксцентричный способ борьбы с зависимостью теперь доступен всем — даже Google слушает