Новый инструмент от Google для распознавания и поиска объектов на видео можно легко обмануть

Google недавно выпустила Cloud Video Intelligence API — интерфейс, помогающий разрабатывать приложения, которые способны распознавать и искать нужные объекты в пределах видеоряда. Сейчас любой может протестировать API на официальном демонстрационном сайте — инструмент быстро выделяет ключевые составляющие видео, распознает смену кадров и расставляет теги.

На картинке выше инструмент верно определил теги: «животное», «дикая природа», «зоопарк», «туризм» и т.д. Всё бы хорошо, но исследователи из Network Security Lab доказали, что Video Intelligence довольно просто обмануть.

В демонстрационное видео они вставили изображение автомобиля Audi таким образом, чтобы оно появлялось каждые две секунды. Изменение не слишком заметно невооружённым глазом, так как картинка добавляется через каждые 50 кадров при частоте смены кадров, равной 25. Зато теперь API думает, что видео не про животных, а про машины.

Авторы исследования замечают:

Подобная уязвимость инструмента распознавания ставит под сомнение возможность его использования в реальных приложениях. Важно разрабатывать системы, которые работают одинаково хорошо в различных условиях.

Видимо, в ближайшее время API останется на этапе демонстрации и будет подвергнут тщательному тестированию.

Источник: TechXplore