Apple создала систему компьютерного зрения для автономных машин

В докладе компании основное внимание уделяется тому, как получить больше информации из данных, захватываемых сенсорами беспилотников.
VoxelNet

Амбиции Apple по созданию собственного беспилотного автомобиля постепенно угасли. Сотрудники компании переключились на создание ПО для автономных машин. В июне 2017 года главный исполнительный директор Apple Тим Кук сообщил, что яблочная компания нацелена на разработку системы управления беспилотниками, которая может быть использована в различного вида транспортных средствах. Этот проект должен стать своеобразной матерью всех проектов ИИ.

VoxelNet

Исследование, проведённое отделом машинного обучения Apple, подтверждает выбранный путь развития компании в сфере беспилотников. Документ описывает систему сопоставления объектов и данных, которая может быть применена в различных областях: от автономной навигации беспилотников и роботов до внедрения в дополненную и виртуальную реальности. По правде говоря, эта статья является лишь академическим исследованием и не означает, что Apple работает над конкретными примерами использования описанной системы.

Система под названием VoxelNet создана специально для улучшения качества данных, получаемых с сенсоров компьютерного зрения автономных машин, а именно с датчиков LIDAR. Эти компоненты являются неотъемлемой частью многих автономных транспортных средств и работают следующим образом. Испускаемый луч лазера отражается от окружающих беспилотник объектов, создавая таким образом 3D-модель окружения.

Лазеры обеспечивают лучшее качество информации о глубине объектов, чем обычные камеры, но создают неоднородные карты, в которых некоторые участки просто невидимы из-за блокирующих распространение лазера предметов. В результате мы получаем разреженные карты с переменной плотностью точек. Другими словами, неоднородность карт недопустима для безопасного передвижения беспилотников.

VoxelNet

Что предлагают инженеры Apple?

Чтобы обойти возникающие при использовании лазеров проблемы, инженеры зачастую развёртывают ряд дискретных систем, которые сначала делят 3D-данные LIDAR на интересующие их области (карты разбиваются на трёхмерные пиксели, известные как вокселы), а затем классифицируют то, что находится внутри каждой из областей: велосипеды, пешеходы, уличные знаки и так далее.

VoxelNet сжимает эти процессы в единую нейронную сеть, что приводит к более эффективной системе, чем её прямые предшественники. Авторы системы Инь Чжоу и Онцел Тузел сравнили производительность VoxelNet с рядом конкурирующих программ, и она по многим показателям превзошла их.

Мало кто использует LIDAR напрямую

Является ли это новаторской идеей использования в беспилотных технологиях? Не совсем. Роланд Меертенс, голландский инженер, разрабатывающий системы компьютерного зрения для автономных транспортных средств, согласился, что результаты работы системы впечатляют. Но он также отметил, что другие фирмы уже давно используют разные методы для преодоления недостатков LIDAR. Например, они объединяют 3D-данные LIDAR с сигналами, получаемыми с обычных камер.

Tesla вообще не использует LIDAR, но их автономные машины — одни из лучших. Хотя VoxelNet и может потенциально использоваться в беспилотниках, она будет, в основном, интересна для других исследователей, работающих с подобными данными.

Блог Apple о машинном обучении

Отметим, что данная статья находится в публичном доступе. Это не похоже на обычную практику Apple. Компания, прежде всего, известна своей скрытностью в отношении любых разрабатываемых ею технологий. Это кардинально отличает её от Google и Facebook, которые любые свои достижения сразу представляют общественности.

Начав свой блог машинного обучения, Apple приоткрылась сообществу разработчиков. На данный момент в нём рассмотрен ряд инструментов ИИ, лежащих в основе важных продуктов Apple, таких как идентификация лиц (для Face ID) и распознавание речи (для Siri).

Источник: The Verge