NVIDIA нашла способ тренировать генеративный ИИ на меньшем наборе данных

Компания нашла необычный способ повторного использования уже имеющихся данных. Для этого она всячески искажала их, показывая нейросети, как не надо делать при создании новых вариаций.

Суть нового метода достаточно проста. Если раньше алгоритму, занимающемуся «придумыванием» новых изображений, нужно было тренироваться на 50-100 тыс собранных заранее данных, то сейчас это число заметно сократится. Инженеры NVIDIA искажают уже имеющиеся изображения, обучая на них нейросеть различным вариациям. А для избежания перегрузки модели, делают это лишь на части тренировочного пути.

По словам разработчиков, новый метод прекрасно показывает себя и при обучении ИИ написанию нового текста. Единственное, в чём новый метод вряд ли будет адекватно работать — это медицина, а именно распознавание редких неврологических заболеваний. Но специалисты NVIDIA не расстраиваются и уже заявляют, что решению этой проблемы будет уделено особое внимание в дальнейшем.

Источник: Блог NVIDIA