Почему Data Office – не модный термин, а новая карьерная возможность
Потребность в специалистах по Data Office растёт. В статье рассказали, кто эти люди — и как устроена сфера в целом.
2К открытий9К показов
Сейчас о важности Data Office говорят в основном крупные компании, но в ближайшие годы он в том или ином виде станет частью большинства бизнесов, которые работают с данными. А значит вырастет потребность в специалистах по Data Office. В статье рассказываем, чем эти люди занимаются сейчас и кому подходит такая работа.
Дмитрий Тарасов
Директор центра разработки аналитических решений «Ростелеком»
Что такое Data Office
Есть три основных значения:
- Функция работы с данными внутри компании. Цель — привести данные в тот вид, который позволит на их основе принимать и монетизировать управленческие решения.
- Обособленное подразделение, работающее с данными. В российском секторе пока что присутствует в крупном и отчасти в среднем бизнесе. Процесс перехода небольших компаний на облачные решения, SaaS и PaaS-платформы, которые предоставляли подобный сервис, замедлился из-за ухода многих международных игроков.
- Интерфейс доступа к накопленным данным. Проще говоря, информация: какие данные у компании есть, где применяются, как устроены процессы их обработки и так далее — всё, что обычно называют Data Governance.
Перспективы развития Data Office
Согласно прогнозу Gartner, в ближайшее время Data Office станет «критически важной функцией, сравнимой с ИТ, бизнес-операциями, HR и финансами в 75% крупных компаний».
Сейчас функция работы с данными есть у всех топовых игроков российского технологического бизнеса, ритейла, телекома; постепенно она охватывает и средний бизнес. Так что поле для применения талантов действительно широкое.
Универсальности Data Office добавляет модульная структура: не нужен Data Lake — можно обойтись без него, не требуется Data Governance — аналогично. В каждой компании Data Office будет таким, каким его хочет видеть бизнес.
Структура Data Office
Работа с данными состоит из нескольких блоков, которыми занимаются разные специалисты: таким образом, прийти к этой работе можно из множества областей. Для примера возьмём типичный набор блоков, из которых состоит Data Office в крупной компании.
Методологический
Отвечает за то, как правильно считать показатели, которые мы хотим извлекать из данных, какие данные брать, из каких систем — по сути, это фундамент работы Data Office. Благодаря ему создаётся single point of truth — единое понимание накопленных данных и методология расчёта показателей для аналитики.
Всем знакома такая вещь, как выручка — но оказывается, взгляды на то, что считать выручкой, у подразделений одной компании сильно разнятся: одни рассматривают РСБУ, другие МСФО, одни с учётом сопоставимости с предыдущими периодами, другие без и так далее.Между тем есть совет директоров, CEO, CFO и, конечно, их не устраивает ситуация, когда у них 25 разных выручек. Им нужно получить какую-то достоверную точку отсчёта. Здесь и возникает та самая регламентирующая функция Data Office, которая обеспечивает договорённость со всеми игроками и генерирует правильные точки входа в данные.
В основном в этом блоке работают бизнес-аналитики и владельцы продуктов/процессов/сервисов. От них требуют хорошего знания бизнес-процессов, их моделирования и реинжиниринга. Кроме того, очень важны коммуникативные навыки, знание нотаций моделирования бизнес-процессов.
Технический
Зона ответственности — построение систем хранения и обработки данных внутри компании, включая весь спектр интеграции, систему управления мастер-данными (MDM), разработку прикладных сервисов доступа к данным. И здесь задействован целый кластер ролей: архитекторы, бизнес- и системные аналитики, разработчики, тестировщики, администраторы, DevOps. Их общая цель — получить мощное и надёжное хранилище.
Для хорошей работы нужна служба эксплуатации и поддержки этого хранилища. В этой же службе могут быть и DBA — администраторы баз данных, которые следят за работоспособностью и производительностью базы данных, занимаются её техническим обслуживанием, мониторят загрузку хранилища и разбирают инциденты.
Часто технические команды становятся хорошими инкубаторами для роста: в них вместе работают и junior, и middle, и senior-специалисты. Конечно, никто не доверит джуну задачи по сборке ядра хранилища, но ему и без этого будет чем заняться.
Технический стек зависит от целевого стека компании, но он всегда включает знание SQL, 1–2 наиболее распространённых языка программирования (часто Python и Java), Git, Jira + Confluence, навыки работы с наиболее распространёнными системами ETL и оркестрации. Почти всегда требуются технический английский и навыки работы с технической документацией.
Взаимодействие с бизнесом или Data Stewards
Эти специалисты помогают бизнесу ориентироваться в накопленных данных, подсказывают уже существующие решения, чтобы не создавать новый велосипед, обучают пользователей работе с данными. Для работы стюардом необходимо хорошо понимать бизнес и знать его потребности, а также ориентироваться в данных компании и уметь пользоваться инструментарием Data Office.
Визуализация данных
Вряд ли кого-то делает счастливым сам факт обладания 100 терабайтами табличек — нужны люди, которые будут ими пользоваться, а для этого данные придётся преобразовать в более удобный вид. Этим занимаются BI-разработчики, создающие BI-дашборды — инструменты, позволяющие бизнесу пользоваться накопленными данными.
Финальный этап многих дата-проектов — удобная, простая для понимания, интерактивная бизнес-отчетность. Нередко за парой страниц с графиками, гистограммами и визуализациями стоят тысячи часов работы специалистов Data Office.
Data Science
Дата-сайентисты не просто реализуют инструменты доступа к данным, но и извлекают из них непосредственную пользу, в основном через сборку моделей: предиктивных, прогностических, аналитических и так далее. Это основной способ конвертировать накопленные данные в прибыль компании. Предсказание оттока клиентов или сотрудников, определение наиболее выгодной стратегии работы с клиентом, разработка новых программных продуктов — всё это сфера ответственности DS.
Для работы в этом стеке нужны хорошая математическая подготовка, знание матанализа, статистики, линейной алгебры. Но главнее — готовность учиться практическим инструментам и искать их прикладное применение.
Анализ данных
Аналитики могут быть не внутри отдела Data Office, а в бизнес-подразделениях. Именно эти специалисты отвечают на вопрос, почему случилось то, что случилось (выросли продажи, упала прибыль и так далее). Если это хорошие дата-аналитики, они отвечают ещё и на вопрос, что с нами будет, если мы поступим так-то и так-то, и помогают руководству сформулировать правильные управленческие решения.
Для такой прогностической работы нужно понимать закономерности бизнес-процессов и уметь пользоваться математическими инструментами, как и в Data Science.
Насколько реализуема подобная структура Data Office? На самом деле, многие российские компании этот путь уже прошли: если взять, например, банковский сектор, телеком или крупный ретейл, все топовые игроки имеют аналогичную структуру у себя.
Функционал Dаta Office на примере «Ростелекома»
Ключевые признаки работы в Data Office — высокий уровень ответственности и разнообразие задач. Например, в нашей компании эта структура выполняет следующие функции:
- Предоставляет отчётность для бизнеса и поддерживает эту отчётность. Звучит как-то скучно и по-бухгалтерски, но, на самом деле, это крайне важная для бизнеса функция: невозможно управлять тем, что ты не можешь измерить.
- Проводит всю подготовительную работу для Data Science. Сюда входят сборка данных, подготовка датасетов, их разметка, контроль качества и так далее.
- Является точкой входа для аналитиков данных. Им Data Office предоставляет возможность получить инфраструктуру и данные, на которых они могут разворачивать и проверять свои гипотезы.
- Обслуживает портал Data Office rt.ru. Этот портал позволяет клиентам от бизнеса легко и просто находить нужные отчёты, показатели, метрики и получать доступ к BI-дашбордам. Очень удобно, особенно когда у компании несколько тысяч продуктовых отчётов — как в нашем случае.
- Взаимодействие с Self Service-командами. Так называются компактные гибкие команды, готовые быстро закрывать потребности бизнеса: выводить быстрые релизы, обеспечивать небольшой Time To Market и небольшую стоимость владения этой функцией. Date Office предоставляет Self Service-командам данные, серверные мощности, ну и в целом обеспечивает их инфраструктурой, методологией, инструментами.
Ключевые сложности в работе Data Office
Все проблемы можно поделить на технические и нетехнические.
Технические проблемы:
- ограничения по инструментарию;
- ограничения с точки зрения регламента.
Они более просты: преодоление этих проблем в технической же области обычно и лежит. Где-то увеличение мощности «железа», где-то использование другого инструмента, где-то оптимизация и так далее.
Основные нетехнические проблемы:
- проблема постановки задач бизнесом;
- несовпадение языка бизнеса и систем-источников;
- вопрос устаревания данных.
Как справиться с этими проблемами? Не принимать требования от бизнеса! Ну а если серьёзно, простого и быстрого решения здесь быть не может — хотя бы потому, что бизнес и IT зачастую живут совершенно в разных измерениях.
И есть несколько практик, которые упрощают работу Data Office
- сделать хорошие и качественные шаблоны, по которым будут писаться требования, и научить бизнес работать с этими шаблонами;
- выделить product owners со стороны бизнеса;
- повысить уровень диджитализации бизнеса;
- создать проектный офис, который станет шлюзом между Data Office и хотелками от бизнеса;
- использовать Self Service-команды — это очень эффективный проводник требований, поскольку такие команды смотрят и в IT, и в бизнес, и понимают и тех, и других.
Что в итоге?
Работа в Data Office — хороший способ быстро прокачаться в профессии за счёт разнообразной деятельности и высокого уровня влияния на бизнес. В большинстве компаний специалисты этого подразделения не просто работают с массивом данных, а решают широкий круг внутренних задач бизнеса, в том числе и стратегических. Результативность Data Office напрямую влияет на бизнес-показатели компании.
В Data Office много направлений и много перспектив: с каждым днём данных становится всё больше, поэтому ценность этих специалистов растёт. Главные личностные качества для такой работы — ответственность за результат и проактивность, то есть качество «мне не всё равно». Без него будет сложно.
Эта работа подходит для молодых и амбициозных: 29 % CDO, опрошенных Gartner, младше 40 лет. Для реализации в Data Office пригодятся не только обширные знания и набор hard и soft skills, но и стрессоустойчивость: в процессе придётся решать много проблем.
А как считаете вы, прочитав эту статью: подходит ли вам работа в Data Office? И хотели бы вы работать там?
2К открытий9К показов