Графовая аналитика, обучение с подкреплением и ModelOps — тренды ML 2020 для задач бизнес-аналитики
Компании всё активнее приспосабливают AI и ML для своих нужд и не собираются останавливаться. Разбираем тренды AI и ML на 2020 год с точки зрения бизнеса.
6К открытий6К показов
Пять трендов AI и ML в российской бизнес‒аналитике от команды Advanced Analytics компании GlowByte.
Тренд №1 — Автоматизированное машинное обучение (AutoML)
Что это?
С 2019 года мы наблюдаем развитие рынка инструментов автоматизированного машинного обучения (Automated machine learning или AutoML).
Если кратко, парадигма AutoML — это одна большая кнопка «построить хорошую модель».
AutoML часто позиционируют как инструмент, с которым могут работать представители бизнеса, не обладающие технической экспертизой — то есть человеку не нужно техническое образование для того, чтобы решить Data Science задачи.
Что будет в 2020?
Популярность инструментов AutoML будет расти. Но важно понимать, что говорить об AutoML как о самостоятельном подходе пока рано, особенно в контексте больших корпораций. AutoML — скорее инструмент, помогающий специалистам по машинному обучению выполнять первичную проверку гипотез, проводить быстрые пилоты, создавать прототипы и строить benchmark модели для дальнейшего углублённого анализа.
Тренд №2 — Объяснимый ИИ (XAI)
Что это?
Объяснимый искусственный интеллект (Explainable AI или XAI).
Бизнес-пользователю важно понимать логику, которая стоит за принятием решения. Особенно это характерно для областей, где исторически господствовали легко интерпретируемые классификационные модели вроде деревьев решений или логистической регрессии (например в кредитных рисках, целевом маркетинге, страховании) и где, с одной стороны, уже всем очевидно, что использование, скажем, xgboost даст кратно лучшие результаты, а с другой — есть не только процессные ограничения, но и желание найти скрытые и неочевидные взаимосвязи.
Что будет в 2020?
Последние годы эту брешь между точностью и интерпретацией закрывают методы вроде LIME, XSHAPE и других, и судя по высокой активности в академической среде, в 2020 году нас ждёт их заметное распространение.
Тренд №3 — Обучение с подкреплением (RL)
Что это?
Обучение с подкреплением (Reinforcement Learning или RL) — это по сути развитие концепции непрерывного A/B тестирования, только вместо двух сегментов — тысячи, и процесс работает непрерывно.
Изначально обучение с подкреплением использовали для игр, в последние годы тренд перешёл и на бизнес‒задачи.
Что будет в 2020?
Специалисты продолжат искать способы использовать RL для бизнеса. На рынке уже много успешных кейсов применения: в оптимизации маркетинга — выбор наиболее подходящей кампании; в цифровом маркетинге — персонализации страниц и рассылок; в кредитный рисках — работа с проблемной задолженностью.
Тренд №4 — Графовая аналитика
Что это?
Графовая аналитика — это набор методов, которые ориентированы на анализ структуры связей между сущностями, а не на свойства сущностей. Примеры графов: связи между людьми в социальных сетях, связи банковских счетов через проходящие по ним переводы, структура владения группы компаний.
Методами графовой аналитики мы анализируем структуру связей и выявляем неочевидные связи.
В задачах машинного обучения графовая аналитика прежде всего позволяет строить более сильные предикторы — переменные, которые описывают окрестности интересующей нас сущности. Например мы можем получить ответы на вопросы: «Как влияет на кредитный рейтинг компании рейтинг её контрагентов или контрагентов контрагентов или в принципе всей цепочки поставок?».
Благодаря методам графовой аналитики мы можем ограничиваться не только прямыми связями, но и окрестностями по связям различной длины.
Что будет в 2020?
Сейчас графы успешно применяются для анализа сущностей с «естественной» сетевой структурой, таких как социальные сети. В дальнейшем мы увидим всё больше графов для сущностей с неочевидной сетевой структурой, таких как выстраивание последовательностей цепочек событий происходящих с клиентом или анализ причинно-следственных отношений для задач управления маркетинговыми коммуникациями.
Тренд №5 — Операционализация машинного обучения (ModelOps)
Что это?
Интерес к машинному обучению растёт каждый год. Лидеры почти всех индустрий вовлечены в R&D и пилотирование применения машинного обучения и углубленного анализа данных для задач бизнеса. Как следствие сейчас концентрация усилий сдвигается на внедрение результатов успешных пилотов в промышленную эксплуатацию.
И соответственно возникает потребность и в методологии выстраивания бизнес-процессов вокруг так называемого жизненного цикла моделей машинного обучения и в инструментах автоматизации этих процессов.
Это направление получило название ModelOps, по аналогии с DevOps — акроним от Model, под чем понимается модель машинного обучения, и Operations, под чем понимается ИТ эксплуатация.
Что будет в 2020?
На рынке уже есть более 50 решений и инструментов, так или иначе связанных с задачами ModelOps, среди которых бесплатные, открытые решения (например MLFlow, KubeFlow) и решения от вендоров — лидеров в области Data Science, таких как SAS и IBM.
В этом году, вероятно, мы увидим качественное развитие отрасли, а именно движение в сторону унификации как подходов к методологии управления жизненным циклом моделей машинного обучения, так и к техническим решениям для автоматизации процессов.
6К открытий6К показов