Microsoft разработала бота-художника

Новости

Программу обучили создавать рисунки по текстовым описаниям.

1К открытий1К показов

Исследователям из Microsoft удалось разработать нейросеть, умеющую рисовать картинки по текстовому описанию. Технология получила название Attentional Generative Adversarial Network (AttnGAN).

Особенности

В основу бота положено две модели машинного обучения, одна из которых отвечает за генерацию изображения по тексту, а другая проверят его достоверность. Все это происходит с усиленной опорой на анализ актуальных слов из описания на естественном языке, что позволяет создавать правдоподобные рисунки по частям без потери существенных деталей.

Кроме того, обученная программа умеет дорисовывать объекты, которые по смыслу дополняют картину, даже если они напрямую не прописаны в текстовом задании. Например, большинство птиц на фото сидят на ветках, и сеть, вероятнее всего, в таком виде их и изобразит.

Разработчики считают, что при наличии достаточного количества вычислительных мощностей, бота можно было бы обучить рисовать мультики по тексту сценария.

Математическое описание модели и больше примеров доступно в официальном отчете.

1К открытий1К показов

Также рекомендуем

Секреты промпт инжиринга: детали, которые вы не заметили

Рассказываем о трёх секретах, которые вы знаете, но не умеете управлять. Уверен, что после изучения, вы будете точно лучше и правильно использовать ИИ и получать крутые ответы быстрее.

Где арендовать GPU в 2025: подборка GPU‑хостингов с адекватной ценой и SLA

Сравниваем GPU-хостинги 2025 года по ценам, доступности и гарантиям SLA.

Нейросети для ВКР: список ИИ-помощников для написания выпускной квалификационной работы

Полный список нейросетей для написания ВКР. Лучшие сервисы искусственного интеллекта для генерации выпускной квалификационной работы.

Кем стать: дата-сайентистом, аналитиком, инженером данных или ML

Специализации в Data Science — дата-сайентист, аналитик, дата-инженер, ML-инженер. Кем стать.