Google разработала алгоритм AutoAugment, создающий уникальные изображения на основе существующих
Новости Отредактировано
AutoAugment изменяет картинки путем отражения, обрезания и изменения цвета. Так можно увеличивать объем тренировочных наборов без добавления новых данных.
2К открытий2К показов
В своем блоге команда Google AI рассказала о новом алгоритме AutoAugment, который дополняет данные для обучения моделей компьютерного зрения изображениями, созданными на основе существующих. Система трансформирует картинки путем отражения, обрезания или изменения цвета. Это позволяет увеличивать объем тренировочных наборов без добавления новых данных.
Зачем это нужно?
Качество работы интеллектуальной системы напрямую зависит от количества и разнообразия данных, на которых ее обучали. Однако собрать достаточно широкие наборы бывает сложно. Один из способов преодолеть этот барьер — жестко прописать правила изменения изображения, чтобы на основе одного создать несколько: перевернутую или симметрично отраженную копию.
Специалистам Google AI удалось с помощью обучения с подкреплением создать алгоритм, самостоятельно определяющий правила, по которым необходимо изменить то или иное изображение, чтобы получить уникальное и при этом не исказить его.
Виды правил
Google отмечает, что некоторые правила очевидны для человека, а до других додуматься сложно. В пример приводится метод mixup, когда нейросеть анализирует пару изображений, в которой одно располагается над другим.
AutoAugment умеет отражать изображения по вертикали и горизонтали, поворачивать, менять цвет и так далее. Кроме того, алгоритм комбинирует правила преобразования, а также предотвращает создание копий с одинаковыми изменениями.
Система учитывает и специфику конкретного набора. В случае изображений с номерами домов (набор SVHN) она использует геометрические преобразования, к примеру, сдвиг, а также изменение цвета. Похожие картинки встречаются и в самом наборе.
В наборах CIFAR-10 и ImageNet AutoAugment не пользуется сдвигом и полным изменением цвета — это может привести к созданию нереалистичных фотографий. Вместо этого алгоритм, сохраняя основную цветовую гамму, немного корректирует оттенки.
Результаты
В качестве теста специалисты Google обучали распознающую нейросеть, дополняя набор данными с помощью своего алгоритма. Для ImageNet получили новый рекорд точности — 83,54 %. На CIFAR10 уровень ошибок составил 1,48 %, что на 0,83 % лучше, чем показатель других алгоритмов расширения наборов. В отношении SVHN AutoAugment помог уменьшить процент ошибок с 1,3 % до 1,02 %.
С появлением и распространением Интернета собирать данные стало намного проще. Однако для специфических отраслей количество данных остается проблемой. Это касается и систем отслеживания популяций различных животных, к примеру, приматов. В таких случаях может быть полезна новая парадигма машинного обучения от DeepMind, которая не требует большого количества данных.
2К открытий2К показов