Исследователи обнаружили, что нейронные сети не могут распознавать оптические иллюзии

Optical illusion cover

В последнее время машинное обучение зашло далеко вперёд: нейронные сети научились понимать содержание картинок, определять человеческие лица, даже создавать подобные изображения. Поэтому, казалось бы, заставить машины идентифицировать и создавать оптические иллюзии может быть так же просто.

С этим вопросом столкнулись учёные из Луисвиллского университета Роберт Уильямс и Роман Ямпольский. Они попытались научить нейронные сети распознавать и генерировать иллюзии, но это оказалось гораздо сложнее, чем предполагалось.

Почему это сложно?

Глубокое обучение нейронных сетей базируется на двух основных факторах: мощные машины с надлежащим программным обеспечением и огромные базы данных, на которых учатся нейронные сети. Чтобы научить компьютер распознавать на картинке лицо, потребуется база данных, содержащая более десяти тысяч изображений с чётко обозначенными лицами. По ним нейронная сеть определит наиболее характерные черты, к примеру, два глаза, нос и рот. Картинок же со статическими иллюзиями несколько тысяч, а уникальных иллюзий, вероятно, всего лишь несколько десятков.

Первые попытки

Уильямс и Ямпольский попробовали научить нейронную сеть распознавать оптические иллюзии по тому же принципу. Первостепенной проблемой стало отсутствие баз данных с оптическими иллюзиями для обучения. Тем не менее, учёным удалось собрать базу данных из более чем 6000 таких изображений, а затем создать генеративно-состязательную сеть для формирования иллюзий.

Но эксперимент провалился: после 7 часов обучения на видеокарте NVIDIA Tesla K80 учёные так и не получили желаемого результата. Они считают, что основная проблема кроется в коренном различии человеческого и компьютерного зрения. Нейронные сети пока не способны понять принципы, по которым составляются оптические иллюзии.

В сентябре 2018 года команда учёных из Брауновского университета (США) тоже провела свой эксперимент с оптическими иллюзиями и нейросетью. Исследователи представили нейронную сеть, чьё восприятие изображения ограничено физиологией зрительной коры головного мозга приматов.

 

via MIT Technology
Source: научные труды Р. Уильямса и Р. Ямпольского