Написать пост

План обучения для специалиста по Data Science

Аватар Евгений Туренко

Детальный пошаговый план обучения по специальности Data Sientist. Если вы хотели стать спциалистом по Data Science, но не знали, с чего начать.

Обложка поста План обучения для специалиста по Data Science

Благодаря Data Science мы можем контролировать взлёты и посадки в самых больших аэропортах, можем анализировать и прогнозировать появление эпидемий без врачей. Благодаря не только современной технике, но и тем обученным программам, которые в ней установлены, доктора могут практически безошибочно ставить сложные диагнозы в некоторых отраслях медицины. Более того, у нас даже есть беспилотный транспорт и с каждым годом он лучше и умнее! Предлагаем вам не оставаться в стороне от такой интересной и перспективной науки и стать на сторону её развития.

Примечание У нас есть планы обучения и по другим специальностям.

Базовый (связующий модуль)

  1. CS50 — курс Гарварда по программированию. Рассматривается построение алгоритмов, поиск наиболее эффективных методов решения проблемы. Также присутствует практика на языках C, Python и JavaScript;
  2. Математика и информатика;Зачем программисту нужна информатика?
  3. Освоение программирования по программе «Nanodegree — Learn to Code» от Udacity.

Зачем нужен этот модуль?

Если вы пришли в программирование из другой специальности или же были верстальщиком или веб-дизайнером, то этот модуль поможет расширить границы ваших познаний в программировании.

Ядро науки о данных

Программа дополнительного образования от Udacity «DataAnalyst» (платно и на английском).

Если у вас есть желание подстроить программу образования под себя, то это будет бесплатно. Предлагаем следующую последовательность бесплатных курсов, входящих в программу выше:

  1. Введение в инференциальную статистику;
  2. Введение в описательную статистику;
  3. Введение в аналитическую обработку данных (с применением NumPy и Pandas);
  4. Введение в первичную обработку данных;
  5. SQL для аналитической обработки данных;
  6. MongoDB для аналитической обработки данных (при возможности и желании можно изучить аналитическую обработку данных с помощью языка R.);
  7. Введение в Машинное обучение;
  8. Визуализация данных и работа с D3.js;
  9. A/B тестирование.

Дополнительные курсы на русском языке

Машинное обучение

  1. Введение в машинное обучение;
  2. Обучение работе с TensorFlow с применением в реальных приложениях;
  3. Машинное обучение и масштабирование;
  4. Нейронные сети и машинное обучение.

Разработка программного обеспечения

Python

  1. Тестирование и отладка;
  2. Использование Git и GitHub для контроля версий;
  3. Создание реактивных аналитических веб-приложений на Python (статья).

R

Разработка программного обеспечения на R (ниже перечислены отдельные курсы, входящие в состав программы по обучению разработке программного обеспечения на языке R).

  1. Программное окружение и R;
  2. Продвинутый уровень написания программ на R;
  3. Сборка пакетов на R;
  4. Сборка инструментов визуализации данных.

Дополнительные материалы

  1. Введенние в Hadoop и MapReduce;
  2. Python как инструмент доступа к веб-данным.

Не обязательно пытаться освоить всё и сразу. Есть мнение, что для Data Scientist’a достаточно знать только Python, а без R можно обойтись. Другие считают наоборот. В любом случае, пробуйте, выбирайте то, что вам ближе и у вас несомненно всё получится.

Чтение по теме: Как создать Data Science портфолио
Следите за новыми постами
Следите за новыми постами по любимым темам
44К открытий44К показов