Google разработала алгоритм AutoAugment, создающий уникальные изображения на основе существующих

Новости Отредактировано

AutoAugment изменяет картинки путем отражения, обрезания и изменения цвета. Так можно увеличивать объем тренировочных наборов без добавления новых данных.

2К открытий2К показов

В своем блоге команда Google AI рассказала о новом алгоритме AutoAugment, который дополняет данные для обучения моделей компьютерного зрения изображениями, созданными на основе существующих. Система трансформирует картинки путем отражения, обрезания или изменения цвета. Это позволяет увеличивать объем тренировочных наборов без добавления новых данных.

Зачем это нужно?

Качество работы интеллектуальной системы напрямую зависит от количества и разнообразия данных, на которых ее обучали. Однако собрать достаточно широкие наборы бывает сложно. Один из способов преодолеть этот барьер — жестко прописать правила изменения изображения, чтобы на основе одного создать несколько: перевернутую или симметрично отраженную копию.

Специалистам Google AI удалось с помощью обучения с подкреплением создать алгоритм, самостоятельно определяющий правила, по которым необходимо изменить то или иное изображение, чтобы получить уникальное и при этом не исказить его.

Виды правил

Google отмечает, что некоторые правила очевидны для человека, а до других додуматься сложно. В пример приводится метод mixup, когда нейросеть анализирует пару изображений, в которой одно располагается над другим.

AutoAugment умеет отражать изображения по вертикали и горизонтали, поворачивать, менять цвет и так далее. Кроме того, алгоритм комбинирует правила преобразования, а также предотвращает создание копий с одинаковыми изменениями.

Google разработала алгоритм AutoAugment, создающий уникальные изображения на основе существующих 1

Система учитывает и специфику конкретного набора. В случае изображений с номерами домов (набор SVHN) она использует геометрические преобразования, к примеру, сдвиг, а также изменение цвета. Похожие картинки встречаются и в самом наборе.

Google разработала алгоритм AutoAugment, создающий уникальные изображения на основе существующих 2

В наборах CIFAR-10 и ImageNet AutoAugment не пользуется сдвигом и полным изменением цвета — это может привести к созданию нереалистичных фотографий. Вместо этого алгоритм, сохраняя основную цветовую гамму, немного корректирует оттенки.

Google разработала алгоритм AutoAugment, создающий уникальные изображения на основе существующих 3

Результаты

В качестве теста специалисты Google обучали распознающую нейросеть, дополняя набор данными с помощью своего алгоритма. Для ImageNet получили новый рекорд точности — 83,54 %. На CIFAR10 уровень ошибок составил 1,48 %, что на 0,83 % лучше, чем показатель других алгоритмов расширения наборов. В отношении SVHN AutoAugment помог уменьшить процент ошибок с 1,3 % до 1,02 %.

С появлением и распространением Интернета собирать данные стало намного проще. Однако для специфических отраслей количество данных остается проблемой. Это касается и систем отслеживания популяций различных животных, к примеру, приматов. В таких случаях может быть полезна новая парадигма машинного обучения от DeepMind, которая не требует большого количества данных.

2К открытий2К показов

Также рекомендуем

ТОП-8 нейросетей для работы с изображениями и фото, лучшие генераторы фото и видео в 2025, редактирование фото с помощью ИИ, генерация картинок по тексту

Лучшие нейросети 2025 года для генерации, редактирования и улучшения фото и видео. Подборка ТОП-8 ИИ-сервисов с описанием возможностей и примерами использования.

Разведчиков начнут обучать Python наравне с иностранными языками. Пока лишь в Британии

MI6 начнет обучать разведчиков Python наравне с иностранными языками, считая код обязательным навыком для работы с ИИ и данными

AI ноябрь: дайджест релизов от Anthropic, Meta, Alibaba и российских команд

Обзор недавних релизов AI-моделей: от генераторов изображений и видео до думающих LLM и инструментов для сегментации

Когда ИИ — не главный. Как финтех учится совмещать алгоритмы и людей: опыт краудплатформы

В статье разберем принципы и преимущества работы скоринг-модели на примере JetLend, и основные задачи, которые с ее помощью решает компания.