Художник научил нейронную сеть создавать портреты несуществующих людей

Майк Тика пишет портреты несуществующих людей. Однако пользуется он для этого не кистью, а «воображением» нейронной сети.

Мне интересны лица людей, в них можно многое прочесть. Меня завораживает этот проект, потому что я люблю размышлять над тем, кем были бы эти люди, существуй они на самом деле.

Майк провел около девяти месяцев, разрабатывая проект «Портреты воображаемых людей», последовавший за «Инцепционизмом» и «Кубиком Грувика».

Художник научил нейронную сеть создавать портреты несуществующих людей 1

GAN, генеративные состязательные сети

В своем проекте Майк использовал генеративные состязательные сети (Generative adversarial networks, GAN):

Я начал экспериментировать с GAN в инсталляции, которую делал совместно с Рефиком Анадолем, где мы использовали данную технику для генерации воображаемых исторических документов из большого архива. После окончания проекта я взглянул на портреты по-новому, применив этот метод.

Положим, вы хотите, чтобы GAN изобразила кошку. Для начала вам потребуется большое количество фотографий кошек. После вы должны подготовить модель для создания изображения кошки, которая учитывала бы все особенности животного: усы, лапы, хвост. Лишь только в качестве базового набора данных для машинного обучения Майк использовал около 20 000 изображений в высоком качестве с портала Flickr.

Художник научил нейронную сеть создавать портреты несуществующих людей 2

Но это только первый шаг. Чтобы получить реалистичное изображение кошки, а не цифровой набросок, вам необходимо создать вторую нейронную сеть, известную как дискриминатор. В то время как первая нейронная сеть (генератор) будет создавать картинки кошек, вторая (дискриминатор) будет сверять работу первой с реальными изображениями кошек и выяснять, достоверны ли они. Основываясь на результатах, система настраивает параметры генератора, чтобы сделать выходное изображение более реалистичным.

Художник научил нейронную сеть создавать портреты несуществующих людей 3

Если вы используете только одну сеть, то размер выходного изображения будет колебаться в диапазоне от 128×128 до 256×256 пикселей. Чтобы увеличить размер изображений, нужно собрать несколько отдельно подготовленных GAN таким образом, чтобы последующий уровень был дискриминатором предыдущего. Данный этап сможет поднять качество изображения, и размер будет варьироваться между 768×768 и 1024×1024 пикселями.

Художник научил нейронную сеть создавать портреты несуществующих людей 4

В конечном итоге Майк хочет сгенерировать 4K-фотографии, однако в настоящее время ему сложно подобрать массив данных для обучения системы:

GAN трудно обучать и трудно контролировать. Нужно четко следить за входными данными, убедиться, что все изображения имеют высокое разрешение, не имеют артефактов и не являются нарисованными. Трудно сравнивать разные прогоны с разными параметрами, потому что нет хорошего, стабильного показателя того, насколько хорошо работает конкретная сеть. Да и выходное изображение строится очень долго. Но мой проект создан не ради точных результатов или показателей, а в первую очередь ради искусства, которое должно вдохновлять и заставлять задуматься.

6К открытий6К показов

Также рекомендуем

GOODY-2 — самый ответственный бот и главный по отмазкам среди нейросетей

Что бы вы у него ни спросили, Goody-2 найдет отмазку или уклонится от ответа. Даже если вы спросите, как дышать или почему щенки такие милые. Это тонкая сатира на ответы популярных Gemin и ChatGPT и, возможно, самый безопасный чат-бот.

Google Bard стал доступен всем желающим

Нейросеть Google Bard, аналог ChatGPT, теперь стала доступна всем желающим. Об этом заявили на пресс-конференции Google I/O.

Как использовать клиентские данные для машинного обучения

Рассказываем, как правильно подобрать данные для машинного обучения, какие данные подойдут и как использовать данные клиентов для ML.

Используем ChatGPT для анализа работы Scrum-команды

Как рассчитать среднеквадратичное отклонение для анализа работы Scrum-команды при помощи ChatGPT. Привели промпты и вывод нейросети.