От пикселей к прогрессу: как компьютерное зрение используют в промышленности
Вместе с Владимиром Валеевым, ведущим CV-инженером Softline Digital (ГК Softline), разбираем, для каких задач эффективно компьютерное зрение, в чем преимущества и как внедрить.
120 открытий2К показов

В эпоху активной роботизации производств технология компьютерного зрения (CV) привлекает все больше внимания промышленности. По данным Института статистических исследований и экономики знаний НИУ ВШЭ, как минимум 78,7% компаний, использующих в работе искусственный интеллект, применяют для автоматизации процессов эту технологию. Вместе с Владимиром Валеевым, ведущим CV-инженером Softline Digital (ГК Softline), разберем, для каких задач эффективно компьютерное зрение, в чем преимущества и как внедрить.
Коротко о технологии компьютерного зрения
Компьютерное зрение — область искусственного интеллекта на стыке машинного обучения (ML) и обработки изображений, связанная с анализом фото и видео. Цифровое изображение представляет собой неструктурированные однородные данные, поэтому обучение моделей компьютерного зрения проводится на размеченных данных: к изображению добавляют семантику (смысл) — задают метки классов, контуры объектов, координаты и т.д.
Если CV-модели хорошо обучены, то способны адекватно извлекать семантику из изображения. Как это работает: нейросети преобразуют входное изображение в его векторное представление в многомерном векторном пространстве, и уже потом, с помощью математических операций, сопоставляют его с заданной ранее семантикой.
Где применяют компьютерное зрение
Компьютерное зрение активно применяется в здравоохранении, логистике, ритейле, но наибольшая доля использования приходится на производство — 25,98%. Как правило, это отрасли, где много рутинной, опасной или требующей высокой точности работы. Например, горнодобывающая промышленность, где системами CV оснащают шахты для мониторинга состояния техники и агрегатов, металлургия и пищевая промышленность (отслеживание техпроцессов, дефектоскопия и т.п.).
Решаемые компьютерным зрением задачи
Автоматизированный контроль качества продукции — вопрос, наиболее часто решаемый с помощью компьютерного зрения. Большинство CV-моделей успешно справляются с подобной задачей независимо от отрасли и вида продукции.
Обычно это:
- определение дефектов продукции на конвейерной ленте (крупный и мелкий брак на металлопрокате, различные дефекты упаковки и др.);
- контроль качества деталей и сборочных узлов (дефекты покраски, брак двигателя и др.);
- автоматический анализ поверхностей и геометрии (дефекты инженерных конструкций), выявление дефектов сварки (рентгенографическая дефектоскопия сварных швов).
Преимущество использования технологии CV для решения таких задач в том, что система работает 24/7, полностью устраняет человеческий фактор и при этом не уступает в экспертизе высококвалифицированным специалистам, которые сейчас в дефиците.
Оптимизация производственных процессов — еще один вопрос, который можно закрыть с помощью компьютерного зрения. Как правило, под оптимизацией производственных процессов в контексте применения CV подразумевается отслеживание объемов готовой продукции и простоев оборудования. Например, когда система видеоаналитики фиксирует объемы сырья на входе в технологическую линию, прослеживает цепочку техопераций на разных этапах его обработки и контролирует объем готовой продукции на выходе — в штуках, массе, площади и т.п.
Одновременно с этим система считает коэффициент выхода готовой продукции и время простоев. Подсчет продукции идет в реальном времени, и на каждой единице продукта, как правило, есть отметка со временем выхода. Это позволяет выявить промежутки, когда продукции не было или было меньше обычного, — так и определяется время простоя.
Также CV решает вопрос мониторинга состояния оборудования — комплекса задач по выявлению аномалий в работе оборудования и предупреждению возможных аварий. Например, система видеоаналитики может проконтролировать состояние конвейерных лент на горно-обогатительном комбинате или токарном станке с ЧПУ на машиностроительном заводе.
По оценке экспертов, использование CV для мониторинга состояния оборудования позволяет предприятиям сократить убытки в среднем на 30%. При этом компьютерное зрение внедряется на производствах и как самостоятельное решение, и как часть системы автоматической диагностики. Интегрируясь с информационными системами, CV обеспечивает:
- непрерывность наблюдения;
- объективные показатели степени износа;
- предсказание частичного и полного выхода из строя;
- мгновенное оповещение об аномалиях.
Предел возможностей CV
Несмотря на то, что компьютерное зрение широко применяется в производстве, его нельзя назвать универсальным решением. Как и у любой другой технологии, у компьютерного зрения есть свои ограничения, и это необходимо учитывать перед внедрением.
Во-первых, CV-модели — статистические. Это значит, что, как и все модели машинного обучения, работают с какой-то вероятностью и не выдают 100%-ный результат. Во-вторых, при обучении нельзя предусмотреть все возможные варианты данных (изображений). В реальности система может столкнуться с чем угодно на фото или видео — это называют проблемой out-of-distribution (OOD).
Например, модель обучена определять дефекты металлопроката. Но так случилось, что на лист металла попал посторонний предмет (допустим, карандаш), который не дефект. Модель в любом случае отнесет его к одному из классов дефектов, потому что не видела этот предмет во время обучения, а значит, может идентифицировать его только как дефект.
Еще один важный момент: если CV-модель что-то не видит, значит, для нее этого не существует. В этом смысле компьютерное зрение сильно уступает человеку. Люди, увидев, что один объект наполовину закрыт другим, понимают, что есть продолжение этого объекта, и могут дорисовать его в своем воображении. CV-модель на такое почти не способна: она не обучена рассуждению, не умеет экстраполировать. Весь ее опыт — статистика визуальных признаков и не более того.
Трудности внедрения
Итак, чувствительность к данным, неспособность рассуждать, специализация на одной конкретной задаче (домене данных) — все эти свойства компьютерного зрения — вызовы при внедрении технологии и для заказчика, и для разработчика. Как подготовиться к проекту, чтобы избежать или минимизировать возможные трудности?
1. Определиться с бизнес-задачей. Без понимания целей и задач невозможно реализовать успешный проект. Если не будет четких метрик оценки эффективности CV-решения, технология вызовет только вопросы и сомнения. Кроме того, стоит определиться с целесообразностью такого внедрения, потому что есть задачи, которые решаются более простыми способами.
Например, надо реализовать остановку конвейера, когда на нем нет объектов, — с этим справятся и датчики. Компьютерное зрение в таком случае не нужно. А вот если требуется, чтобы конвейер останавливался каждый раз, когда на нем находится объект, не соответствующий форме, цвету, маркировке или другим визуальным характеристикам, — это задача для CV.
2. Собрать качественные данные. От качества входных данных и профессионализма/опыта инженеров предприятия зависит 90% успеха. Собирать данные можно вручную или автоматически, но, главное, делать это с пониманием того, как будет решаться задача. Независимо от сложности, данные должны быть точно размечены семантически: проставлены метки классов изображений и координат, выделены контуры объектов, там, где это имеет смысл. Чем лучше размечены данные, тем точнее будет результат работы CV-модели.
3. Ознакомиться с опытом решения похожих задач. Перед тем как приступить к внедрению, важно в целом иметь представление о технологии. Почитать о кейсах других компаний, объективно оценить трудности, с которыми они столкнулись, попробовать перенести чужой опыт на свою ситуацию и заранее обсудить все возможные «подводные камни» с разработчиками CV-решения.
Часто заказчики недооценивают сложность задач, рассчитывают на быстрые сроки и функционал моделей на грани фантастики. Поэтому важно обсуждать метрики эффективности CV в начале проекта, чтобы не попасть в ловушку иллюзорной простоты решения.
Вывод
Сегодня внедрение компьютерного зрения в промышленность демонстрирует большой потенциал. В 2025 году объем рынка CV оценивается в 20,31 млрд долларов, а к 2030-му, согласно прогнозам Mordor Intelligence, этот показатель достигнет 45,91 млрд долларов при среднегодовом темпе роста 17,72%.
Несмотря на существующие ограничения, компьютерное зрение продолжает совершенствоваться и открывает новые горизонты для промышленности. Компании, которые подходят к внедрению осознанно, четко формулируют бизнес-задачи и собирают качественные данные. Для них CV-решения становятся не просто инструментом для повышения эффективности техпроцессов и снижения издержек, но и реальным конкурентным преимуществом.
120 открытий2К показов