Нейросети не могут нарисовать Карлсона. Объявлен челлендж
Нейросеть Midjourney не может нарисовать Карлсона. Объявлен челлендж: тот, кому удастся сгенерировать Карлсона, получит подписку на MJ.
18К открытий18К показов
В телеграм-канале Ai molodca внезапно обнаружили, что нейросеть Midjourney не может нарисовать Карлсона.
Вот, в чём проблема: нейросеть успешно рисует тучного рыжего мужчину в самом расцвете сил, который летает в облаках, но не может пририсовать к телу пропеллер. Он то и дело оказывается частью самолёта на заднем плане. Иногда удаётся сгенерировать мужчину с крыльями феи на спине, но никак не Карлсона.
Конкурс Карлсонов
Канал объявил конкурс: нарисовать Карлсона с использованием MJ и StableDiffusion. Запрос для нейросети можно формулировать только текстом, без использования картинок или референсов.
Приз — базовая подписка на Midjourney или 100 часов GPU в коллабе.
К настоящему моменту под записью набралось 400 комментариев разной степени безумия.
На примере выше наглядно показана проблема с пропеллером. Нейросеть отчаянно пытается куда-нибудь прилепить самолёт, но всё тщетно.
Пример того, насколько буквально нейросети понимают запрос. В целом всё сделано правильно: рыжий, тучный, с пропеллером. Но всё ещё не Карлсон.
Безумный четырёхрукий Карлсон. Такому не очень-то хочется доверять своего Малыша.
Как заставить Midjourney нарисовать Карлсона
Проблема может заключаться в том, что нейросеть не понимает контекста запроса. Она декомпозирует запрос на отдельные фрагменты и пытается собрать изображение из того, что найдётся и релевантно именно фрагментам, а не полному запросу.
Можно использовать одну фишку Midjourney — использовать двойное двоеточие ::
как усилитель логической части сообщения. Этот знак расставляет приоритеты фрагментов в запросе. Объяснить сложновато, приведу пример.
К примеру, по запросу redhead::1 man::2 with airscrew on his back::3
нейросеть будет подбирать в первую очередь изображения пропеллера на спине, затем добавит к результату мужчину, а уже потом, быть может, сделает его рыжим.
Ещё можно использовать двойное короткое тире --
. Оно позволяет исключить из генерации то, чего там быть не должно. Ставить двойное тире нужно после основного запроса.
В случае с Карлсоном нам нужно избавиться от самолетов. Тогда запрос будет примерно таким: redhead::1 man::2 with airscrew on his back::3 --no airplanes
.
Подробнее о настройке нейросети можно узнать здесь.
Мои тщетные попытки
Я решил проверить, действительно ли нарисовать Карлсона — сложная задача.
Отправил первый запрос redhead::1 man::2 with airscrew on his back::3 --no airplanes
и получил вот такой результат. Нейросеть поняла всё превратно и решила, что я хочу видеть человека с впалой спиной.
Подумал, что нейросеть может путаться из-за моей просьбы не рисовать самолёты. Убрал все двоеточия и короткие тире, чтобы задача была попроще. Добавил plump — упитанный. Результат не сильно отличается.
В третий раз я решил, что слово airscrew Midjourney может не понимать. Решил заменить его на куда более понятное propeller. Получилось лучше, начали появляться первые признаки винта на спине, но сам человек почему-то стал красным целиком.
Обрадовался прогрессу. Заменил man на male, а plump на fat, потому что в третий раз получился гуманоид, но не мужчина, а во второй раз мужчина был всего лишь широколицым, но не упитанным.
Оказалось, что обрадовался рано. Убедился, что нарисовать Карлсона — это сложно.
Что дальше?
Попробуйте и вы справиться с задачей. Присоединяйтесь к Midjourney, пытайтесь нарисовать своих Карлсонов и присоединяйтесь к челленджу.
Пожалуйста, присылайте свои результаты в комменты. И не забудьте запросы! Мне будет интересно узнать, что у вас получилось и с какой формулировкой. Может быть, я что-то сделал не так, из-за чего MJ не смогла выдать релевантные изображения.
Ещё, если вдруг решите принять участие в конкурсе, присылайте результаты в Телеграм: всё-таки приз ценный, а конкурс — интересный. Удачи!
18К открытий18К показов