0
Обложка: Нейросети не могут нарисовать Карлсона. Объявлен челлендж

Нейросети не могут нарисовать Карлсона. Объявлен челлендж

В телеграм-канале Ai molodca внезапно обнаружили, что нейросеть Midjourney не может нарисовать Карлсона.

Вот, в чём проблема: нейросеть успешно рисует тучного рыжего мужчину в самом расцвете сил, который летает в облаках, но не может пририсовать к телу пропеллер. Он то и дело оказывается частью самолёта на заднем плане. Иногда удаётся сгенерировать мужчину с крыльями феи на спине, но никак не Карлсона.

Конкурс Карлсонов

Канал объявил конкурс: нарисовать Карлсона с использованием MJ и StableDiffusion. Запрос для нейросети можно формулировать только текстом, без использования картинок или референсов.

Приз — базовая подписка на Midjourney или 100 часов GPU в коллабе.

К настоящему моменту под записью набралось 400 комментариев разной степени безумия.

Telegram @rumdan

На примере выше наглядно показана проблема с пропеллером. Нейросеть отчаянно пытается куда-нибудь прилепить самолёт, но всё тщетно.

Telegram @BaJIeHTuHbI4

Пример того, насколько буквально нейросети понимают запрос. В целом всё сделано правильно: рыжий, тучный, с пропеллером. Но всё ещё не Карлсон.

Telegram @chernix

Безумный четырёхрукий Карлсон. Такому не очень-то хочется доверять своего Малыша.

Как заставить Midjourney нарисовать Карлсона

Проблема может заключаться в том, что нейросеть не понимает контекста запроса. Она декомпозирует запрос на отдельные фрагменты и пытается собрать изображение из того, что найдётся и релевантно именно фрагментам, а не полному запросу.

Можно использовать одну фишку Midjourney — использовать двойное двоеточие :: как усилитель логической части сообщения. Этот знак расставляет приоритеты фрагментов в запросе. Объяснить сложновато, приведу пример.

К примеру, по запросу redhead::1 man::2 with airscrew on his back::3 нейросеть будет подбирать в первую очередь изображения пропеллера на спине, затем добавит к результату мужчину, а уже потом, быть может, сделает его рыжим.

Ещё можно использовать двойное короткое тире --. Оно позволяет исключить из генерации то, чего там быть не должно. Ставить двойное тире нужно после основного запроса.

В случае с Карлсоном нам нужно избавиться от самолетов. Тогда запрос будет примерно таким: redhead::1 man::2 with airscrew on his back::3 --no airplanes.

Подробнее о настройке нейросети можно узнать здесь.

Мои тщетные попытки

Я решил проверить, действительно ли нарисовать Карлсона — сложная задача.

Отправил первый запрос redhead::1 man::2 with airscrew on his back::3 --no airplanes и получил вот такой результат. Нейросеть поняла всё превратно и решила, что я хочу видеть человека с впалой спиной.

Моя первая попытка

Подумал, что нейросеть может путаться из-за моей просьбы не рисовать самолёты. Убрал все двоеточия и короткие тире, чтобы задача была попроще. Добавил plump — упитанный. Результат не сильно отличается.

Вторая попытка, убрал :: и —

В третий раз я решил, что слово airscrew Midjourney может не понимать. Решил заменить его на куда более понятное propeller. Получилось лучше, начали появляться первые признаки винта на спине, но сам человек почему-то стал красным целиком.

Третья попытка. Заменил airscrew на куда более прямолинейное propeller

Обрадовался прогрессу. Заменил man на male, а plump на fat, потому что в третий раз получился гуманоид, но не мужчина, а во второй раз мужчина был всего лишь широколицым, но не упитанным.

Решил ещё уточнить: добавил male вместо man. Всё сломалось, пропеллера снова нет

Оказалось, что обрадовался рано. Убедился, что нарисовать Карлсона — это сложно.

Что дальше?

Попробуйте и вы справиться с задачей. Присоединяйтесь к Midjourney, пытайтесь нарисовать своих Карлсонов и присоединяйтесь к челленджу.

Пожалуйста, присылайте свои результаты в комменты. И не забудьте запросы! Мне будет интересно узнать, что у вас получилось и с какой формулировкой. Может быть, я что-то сделал не так, из-за чего MJ не смогла выдать релевантные изображения.

Ещё, если вдруг решите принять участие в конкурсе, присылайте результаты в Телеграм: всё-таки приз ценный, а конкурс — интересный. Удачи!