5 признаков, что вам пора в Data Science
Хотите в Data Science, но не знаете, какое направление выбрать? Собрали признаки, которые помогут определиться и выбрать профессию.
6К открытий12К показов
Очевидные (и не очень) признаки, которые подскажут, нужно ли вам двигаться в науку о данных и какое направление Data Science выбрать.
Ирина Скорынина
Ведущий аналитик-исследователь
1. Вы скрупулёзно относитесь к мелочам
И кайфуете, когда видите очищенные данные и настроенные графики. И если в данных беспорядок, у вас возникает негодование и желание всё исправить.
Подходящие профессии в ML
Из профессий науки о данных стоит присмотреться к дата-инженеру. Одно из направлений его деятельности — обрабатывать и очищать данные, чтобы дата-сайентисты получали таблицы без повторов, пропусков или неоднородных данных.
2. Вы любите контроль и отчётность
От специалистов, которые работают с данными, всегда ожидают понятных результатов, а значит их нужно уметь собирать и презентовать. А также быть готовым к тому, что в любой момент у вас могут попросить отчёт — от этого никуда не деться.
Подходящие профессии в ML
Аналитик данных чаще всего предоставляет итоги своей работы бизнесу. На нём лежат и интерпретация данных, и отчёты. Например, после A/B-тестирования он выбирает, какие метрики нужно показать заказчику, и составляет презентацию на понятном для бизнеса языке.
3. Вам нравится научная деятельность
Ведь Machine Learning можно применять в разных областях.
Когда я училась на кафедре астрономии, мы снимали объекты в космосе, чтобы определять их положение в пространстве. Делали три снимка, потом с помощью векторизации и логистической регрессии определяли объекты на изображении. При этом засекали время, когда снимки были сделаны, фиксировали координаты обсерватории. После вычисляли азимут и высоту, далее — склонение и прямое восхождение, плавно переходя к самим Кеплеровым элементам орбиты.
Подходящие профессии в ML
ML-researcher редко встречается в индустрии, в основном в крупных компаниях, но зато он больше всего погружен в исследования. Он работает на процесс, то есть во время реализации сложной научной задачи есть риск не совершить открытие. Но если результата удаётся достичь, то такой специалист реализует настоящее открытие, которое, возможно, изменит мир на 180 градусов!
4. Вы и швец, и жнец, и на дуде игрец
В проектах я сама писала код, приходила к дата-инженерам с витринами для моделей. Процесс разработки проекта и его защита перед бизнесом полностью лежали на мне.
Подходящие профессии в ML
Data Scientist погружён в предметную область, в продукт, которым занимается, и плотно общается с бизнесом. Он разбирается в алгоритмах, статистике, дискретной математике, аналитической геометрии. Он хорошо ориентируется в данных, которые берёт для модели, и проверяет, что дата-инженеры всё на совесть почистили. И, в конце концов, он пишет код, который по всем законам разработки должен будет соответствовать правилам безопасности и надёжности.
Какие задачи может выполнять Data Scientist
С помощью машинного обучения в направлениях Data Science можно выполнять не только научные, но и, естественно, более прикладные задачи.
Например, я строила модель, которая прогнозировала отток клиентов. Здесь есть хитрость: нужно предсказывать не сам отток, иначе будем констатировать факт, а «предотток» — месяц перед уходом человека. Это нужно, чтобы успеть что-то предложить клиенту и тем самым его удержать.
Сначала я проводила аналитику таргета совместно с бизнесом — определяла, какого клиента можно считать «отточным», так как у бизнеса много практики и знаний в их предметной области. Например, три месяца он не совершал никаких транзакций или не получал отчислений на карту.
После строила модель. На этом этапе дата-сайентисты пользуются готовыми пайплайнами. Если в компании уже есть похожие витрины данных, то можно взять их за образец, и сделать задачу достаточно быстро. Иногда бывают и нестандартные задачи, где готовые, разработанные командой пайплайны не подходят. Тогда нужно писать код с нуля и создавать для модели новые витрины данных.
Далее выводила модель в пром, и она прогнозировала вероятность оттока клиента в следующем месяце.
На основе этих данных бизнес отбирал тестовую и контрольную выборки и запускал кампанию. Результаты кампании тоже нужно было оценить, чтобы понять, какие метрики важны и отвечают за качество модели.
И, наконец, я представляла бизнесу все результаты кампании, метрики, аналитику, которую можно сделать на основе этих цифр. Например, подтвердилась альтернативная гипотеза или нет. На основе этих показателей бизнес корректирует свои стратегию и кампанию для улучшения дальнейших результатов.
5. Вы умеете договариваться
В Machine Learning недостаточно просто делать fit–predict. Ещё нужно отвечать на письма, проводить презентации, участвовать во встречах. На них не только обсуждают работу, договариваются о результатах, но и разруливают нештатные ситуации.
Иногда бывают ситуации, когда сделать что-то нужно срочно. Сказать: «Ну-ка быстро мне что-то сделайте», — можно, но, как показывает практика, не нужно, потому что вы только вызовете недовольство у коллег. Поэтому важно уметь находить компромиссы, так как спорные ситуации возникают очень часто.
Софт-скилы нужны всем в сфере: и дата-сайентистам, и аналитикам данных, и даже немного ML-инженерам. Их стоит развивать, если хотите расти выше до мидла и готовы брать на себя больше ответственности за людей и проекты.
Чем больше вы напрямую общаетесь с бизнесом, отвечаете на его запросы, тем чаще вас поощряют. К тому же вы не только развиваетесь, но и можете расти в зарплате.
Но главное, в любом деле должно оставаться желание в этом разбираться, пытаться докопаться до сути. Ответьте себе на вопросы, что вы любите делать, что вас радует. Если среди этих пунктов не найдутся программирование или математика, то стоит задуматься, действительно ли вам этого хочется, или это кто-то вам навязал, например, реклама.
А если всё-таки найдутся, то пробуйте. Развиться и стать специалистом можно в любом направлении Machine Learning, если не бояться учиться и совершать ошибки.
6К открытий12К показов