Обложка статьи «Графовая аналитика, обучение с подкреплением и ModelOps — тренды ML 2020 для задач бизнес-аналитики»

Графовая аналитика, обучение с подкреплением и ModelOps — тренды ML 2020 для задач бизнес-аналитики

Пять трендов AI и ML в российской бизнес‒аналитике от команды Advanced Analytics компании GlowByte.

Тренд №1 — Автоматизированное машинное обучение (AutoML)

Что это?

С 2019 года мы наблюдаем развитие рынка инструментов автоматизированного машинного обучения (Automated machine learning или AutoML).

Если кратко, парадигма AutoML — это одна большая кнопка «построить хорошую модель».

AutoML часто позиционируют как инструмент, с которым могут работать представители бизнеса, не обладающие технической экспертизой — то есть человеку не нужно техническое образование для того, чтобы решить Data Science задачи.

Что будет в 2020?

Популярность инструментов AutoML будет расти. Но важно понимать, что говорить об AutoML как о самостоятельном подходе пока рано, особенно в контексте больших корпораций. AutoML — скорее инструмент, помогающий специалистам по машинному обучению выполнять первичную проверку гипотез, проводить быстрые пилоты, создавать прототипы и строить benchmark модели для дальнейшего углублённого анализа.

Тренд №2 — Объяснимый ИИ (XAI)

Что это?

Объяснимый искусственный интеллект (Explainable AI или XAI).

Бизнес-пользователю важно понимать логику, которая стоит за принятием решения. Особенно это характерно для областей, где исторически господствовали легко интерпретируемые классификационные модели вроде деревьев решений или логистической регрессии (например в кредитных рисках, целевом маркетинге, страховании) и где, с одной стороны, уже всем очевидно, что использование, скажем, xgboost даст кратно лучшие результаты, а с другой — есть не только процессные ограничения, но и желание найти скрытые и неочевидные взаимосвязи.

Что будет в 2020?

Последние годы эту брешь между точностью и интерпретацией закрывают методы вроде LIME, XSHAPE и других, и судя по высокой активности в академической среде, в 2020 году нас ждёт их заметное распространение.

Тренд №3 — Обучение с подкреплением (RL)

Что это?

Обучение с подкреплением (Reinforcement Learning или RL) — это по сути развитие концепции непрерывного A/B тестирования, только вместо двух сегментов — тысячи, и процесс работает непрерывно.

Изначально обучение с подкреплением использовали для игр, в последние годы тренд перешёл и на бизнес‒задачи.

Что будет в 2020?

Специалисты продолжат искать способы использовать RL для бизнеса. На рынке уже много успешных кейсов применения: в оптимизации маркетинга — выбор наиболее подходящей кампании; в цифровом маркетинге — персонализации страниц и рассылок; в кредитный рисках — работа с проблемной задолженностью.

Тренд №4 — Графовая аналитика

Что это?

Графовая аналитика — это набор методов, которые ориентированы на анализ структуры связей между сущностями, а не на свойства сущностей. Примеры графов: связи между людьми в социальных сетях, связи банковских счетов через проходящие по ним переводы, структура владения группы компаний.

Методами графовой аналитики мы анализируем структуру связей и выявляем неочевидные связи.

В задачах машинного обучения графовая аналитика прежде всего позволяет строить более сильные предикторы — переменные, которые описывают окрестности интересующей нас сущности. Например мы можем получить ответы на вопросы: «Как влияет на кредитный рейтинг компании рейтинг её контрагентов или контрагентов контрагентов или в принципе всей цепочки поставок?».

Благодаря методам графовой аналитики мы можем ограничиваться не только прямыми связями, но и окрестностями по связям различной длины.

Что будет в 2020?

Сейчас графы успешно применяются для анализа сущностей с «естественной» сетевой структурой, таких как социальные сети. В дальнейшем мы увидим всё больше графов для сущностей с неочевидной сетевой структурой, таких как выстраивание последовательностей цепочек событий происходящих с клиентом или анализ причинно-следственных отношений для задач управления маркетинговыми коммуникациями.

Тренд №5 — Операционализация машинного обучения (ModelOps)

Что это?

Интерес к машинному обучению растёт каждый год. Лидеры почти всех индустрий вовлечены в R&D и пилотирование применения машинного обучения и углубленного анализа данных для задач бизнеса. Как следствие сейчас концентрация усилий сдвигается на внедрение результатов успешных пилотов в промышленную эксплуатацию.

И соответственно возникает потребность и в методологии выстраивания бизнес-процессов вокруг так называемого жизненного цикла моделей машинного обучения и в инструментах автоматизации этих процессов.

Это направление получило название ModelOps, по аналогии с DevOps — акроним от Model, под чем понимается модель машинного обучения, и Operations, под чем понимается ИТ эксплуатация.

Что будет в 2020?

На рынке уже есть более 50 решений и инструментов, так или иначе связанных с задачами ModelOps, среди которых бесплатные, открытые решения (например MLFlow, KubeFlow) и решения от вендоров — лидеров в области Data Science, таких как SAS и IBM.

В этом году, вероятно, мы увидим качественное развитие отрасли, а именно движение в сторону унификации как подходов к методологии управления жизненным циклом моделей машинного обучения, так и к техническим решениям для автоматизации процессов.

Level UP для айтишников