Написать пост

Google анонсировала соревнование по улучшению распознавания рукописного ввода и рисунков

Аватарка пользователя Gregory Bass

Задача участников соревнования состоит в улучшении существующих технологий распознавания или создании нового классификатора рисунков в Quick, Draw!.

Обложка поста Google анонсировала соревнование по улучшению распознавания рукописного ввода и рисунков

В своем блоге команда Google AI рассказала об инициативе на платформе Kaggle по созданию нового классификатора изображений в экспериментальной игре Quick, Draw!. Организаторы говорят, что участникам предстоит обучить распознаватель дудлов на 50 миллионах созданных пользователями картинок с разной степенью информативности для более эффективной работы с рукописного ввода.

Несовершенство алгоритмов Google

Quick, Draw! — это браузерная игра, которая угадывает то, что рисует человек. За два года существования эксперимента пользователи нарисовали более 1 миллиарда рисунков, 50 миллионов из которых были отобраны в специальный датасет, служащий основой для участников конкурса. Инженеры Google утверждают, что нынешняя система не идеальна, т.к. игра сама генерирует новые картинки, многие из которых недорисованы или имеют неправильные ярлыки.

Разработчики разделяют все изображения на 4 категории:

  • верные: компьютер угадывает нарисованный предмет, только когда он полностью готов;
  • верные, но неполные: распознавание происходит до окончания рисования, но предмету не достает деталей;
  • верные, но не распознанные: предмет нарисован верно, но система не может угадать его;
  • неверные: неочевидная интерпретация заданного предмета.

Суть состязания

Задача участников соревнования состоит в улучшении существующих технологий распознавания или создании нового классификатора рисунков, который сможет обучиться на зашумленном наборе данных с некорректно проставленными метками и недорисованными картинками. Затем полученный алгоритм должен пройти тестирование на отобранном вручную сете из другого раздела базы рисунков.

Инициатива проводится на платформе Kaggle, разработанной для анализа и сбора данных. Чтобы получать очки и продвигаться по турнирной таблице, участники должны предлагать свои решения в различных «фрагментах» — методах решения определенных задач.

Соревнование продлится до 4 декабря 2018 года. Призовой фонд — 25 000 $, которые будут разделены между тремя финалистами. По словам организаторов, разработанные системы помогут в улучшении технологий распознавания рукописного текста, картинок и естественного языка.

Алгоритм, лежащий в основе Quick, Draw!, используется и в других экспериментах Google. В мае 2018 года корпорация показала игру World Draw, которая использует технологии распознавания нарисованных пользователем картинок для создания целого виртуального города.

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов