Google разработала алгоритм AutoAugment, создающий уникальные изображения на основе существующих

В своем блоге команда Google AI рассказала о новом алгоритме AutoAugment, который дополняет данные для обучения моделей компьютерного зрения изображениями, созданными на основе существующих. Система трансформирует картинки путем отражения, обрезания или изменения цвета. Это позволяет увеличивать объем тренировочных наборов без добавления новых данных.

Зачем это нужно?

Качество работы интеллектуальной системы напрямую зависит от количества и разнообразия данных, на которых ее обучали. Однако собрать достаточно широкие наборы бывает сложно. Один из способов преодолеть этот барьер — жестко прописать правила изменения изображения, чтобы на основе одного создать несколько: перевернутую или симметрично отраженную копию.

Специалистам Google AI удалось с помощью обучения с подкреплением создать алгоритм, самостоятельно определяющий правила, по которым необходимо изменить то или иное изображение, чтобы получить уникальное и при этом не исказить его.

Виды правил

Google отмечает, что некоторые правила очевидны для человека, а до других додуматься сложно. В пример приводится метод mixup, когда нейросеть анализирует пару изображений, в которой одно располагается над другим.

AutoAugment умеет отражать изображения по вертикали и горизонтали, поворачивать, менять цвет и так далее. Кроме того, алгоритм комбинирует правила преобразования, а также предотвращает создание копий с одинаковыми изменениями.

Алгоритм AutoAugment отражение

Система учитывает и специфику конкретного набора. В случае изображений с номерами домов (набор SVHN) она использует геометрические преобразования, к примеру, сдвиг, а также изменение цвета. Похожие картинки встречаются и в самом наборе.

набор изображений SVHN

В наборах CIFAR-10 и ImageNet AutoAugment не пользуется сдвигом и полным изменением цвета — это может привести к созданию нереалистичных фотографий. Вместо этого алгоритм, сохраняя основную цветовую гамму, немного корректирует оттенки.

алгоритм AutoAugment - изменение цвета

Результаты

В качестве теста специалисты Google обучали распознающую нейросеть, дополняя набор данными с помощью своего алгоритма. Для ImageNet получили новый рекорд точности — 83,54 %. На CIFAR10 уровень ошибок составил 1,48 %, что на 0,83 % лучше, чем показатель других алгоритмов расширения наборов. В отношении SVHN AutoAugment помог уменьшить процент ошибок с 1,3 % до 1,02 %.

С появлением и распространением Интернета собирать данные стало намного проще. Однако для специфических отраслей количество данных остается проблемой. Это касается и систем отслеживания популяций различных животных, к примеру, приматов. В таких случаях может быть полезна новая парадигма машинного обучения от DeepMind, которая не требует большого количества данных.

Источник: блог Google AI

Подобрали два теста для вас:
— А здесь можно применить блокчейн?
Серверы для котиков: выберите лучшее решение для проекта и проверьте себя.