Создатель AI Weirdness обнаружила плохо рисующую, но старательную нейросеть AttnGAN

Новости

Особенность AttnGAN в том, что она требует слишком точно заданных параметров картинки и порой не может определить границы или форму объектов.

1К открытий1К показов

Автор блога AI Weirdness Джанель Шейн (Janelle Shane) рассказала о генеративно-состязательной нейросети под названием AttnGAN, которая обучена рисовать изображения по текстовому описанию. Проблема в том, что она требует слишком точно заданных параметров картинки и порой не может определить границы объектов.

Примеры работ AttnGAN

Джанель отмечает, что, пока нейросеть была натренирована на узком наборе данных в виде птиц, у нее получались сносные изображения:

Создатель AI Weirdness обнаружила плохо рисующую, но старательную нейросеть AttnGAN 1

Однако когда создатели обучили ее на датасете, включающем картинки от овец до торговых центров, она не смогла создать осмысленное изображение по аналогичному описанию. Автор AI Weirdness считает, что ошибка кроется в слишком широком наборе исходных данных, в котором AttnGAN не смогла отобрать подходящие экземпляры:

Создатель AI Weirdness обнаружила плохо рисующую, но старательную нейросеть AttnGAN 2

К тому же, у нее почему-то наблюдается проблема с определением правильного количества отверстий на человеческом лице. Разработчики AttnGAN добавили в контрольный датасет лица знаменитостей для создания фотореалистичных портретов, но нейросети это оказалось не под силу:

Создатель AI Weirdness обнаружила плохо рисующую, но старательную нейросеть AttnGAN 3

В отображении животных и текстуры их шерсти тоже есть определенные ошибки: алгоритм неправильно определяет границу объекта и его формы, из-за чего все изображение текстурировано как шерсть овцы или жирафа:

Создатель AI Weirdness обнаружила плохо рисующую, но старательную нейросеть AttnGAN 4

С другими примерами работ нейросети AttnGAN можно ознакомиться в блоге Джанель Шейн. Кроме того, разработчики предлагают сгенерировать изображение самому.

Автор AI Weirdness называет проект AttnGAN «Visual Chatbot наоборот». Данный чат-бот, о котором мы писали в конце июня 2018 года, анализирует изображение, которое отправляет пользователь, и описывает его, зачастую неправдоподобно.

1К открытий1К показов

Также рекомендуем

Разработчики всё чаще используют ИИ, но доверяют ему всё меньше

Опрос Stack Overflow 2025 года показал, что 80% разработчиков применяют ИИ в работе, но доверие к нему снизилось до 29%. Основная проблема — скрытые ошибки в коде, генерируемом ИИ, которые усложняют отладку.

Нейросети для учебы: ИИ-сервисы для помощи в учебе

Полный список нейросетей для учебы. Лучшие сервисы искусственного интеллекта для помощи в учебном процессе. Обзор стоимости, функционала, преимуществ AI генераторов.

Microsoft вернулась к найму после года увольнений. Но теперь ИИ решает, кого брать, а кого — нет

Microsoft снова нанимает после массовых сокращений, но теперь ИИ решает, кого брать. Компания делает ставку на AI-first сотрудников

Почему банки нанимают ученых для распознавания паспортов, а не open-source модели

Студент собирает распознавание паспортов за выходные, а банки платят миллионы за специальные решения. Разбираемся, почему бесплатные AI-модели не подходят для бизнеса и при чём здесь реальная наука