План обучения для специалиста по Data Science

Благодаря Data Science мы можем контролировать взлёты и посадки в самых больших аэропортах, можем анализировать и прогнозировать появление эпидемий без врачей. Благодаря не только современной технике, но и тем обученным программам, которые в ней установлены, доктора могут практически безошибочно ставить сложные диагнозы в некоторых отраслях медицины. Более того, у нас даже есть беспилотный транспорт и с каждым годом он лучше и умнее! Предлагаем вам не оставаться в стороне от такой интересной и перспективной науки и стать на сторону её развития.

Примечание У нас есть планы обучения и по другим специальностям.

Базовый (связующий модуль)

  1. CS50 — курс Гарварда по программированию. Рассматривается построение алгоритмов, поиск наиболее эффективных методов решения проблемы. Также присутствует практика на языках C, Python и JavaScript;
  2. Математика и информатика;
  3. Освоение программирования по программе «Nanodegree — Learn to Code» от Udacity.

Зачем нужен этот модуль?

Если вы пришли в программирование из другой специальности или же были верстальщиком или веб-дизайнером, то этот модуль поможет расширить границы ваших познаний в программировании.

Ядро науки о данных

Программа дополнительного образования от Udacity «DataAnalyst» (платно и на английском).

Если у вас есть желание подстроить программу образования под себя, то это будет бесплатно. Предлагаем следующую последовательность бесплатных курсов, входящих в программу выше:

  1. Введение в инференциальную статистику;
  2. Введение в описательную статистику;
  3. Введение в аналитическую обработку данных (с применением NumPy и Pandas);
  4. Введение в первичную обработку данных;
  5. SQL для аналитической обработки данных;
  6. MongoDB для аналитической обработки данных (при возможности и желании можно изучить аналитическую обработку данных с помощью языка R.);
  7. Введение в Машинное обучение;
  8. Визуализация данных и работа с D3.js;
  9. A/B тестирование.

Дополнительные курсы на русском языке

Машинное обучение

  1. Введение в машинное обучение;
  2. Обучение работе с TensorFlow с применением в реальных приложениях;
  3. Машинное обучение и масштабирование;
  4. Нейронные сети и машинное обучение.

Разработка программного обеспечения

Python

  1. Тестирование и отладка;
  2. Использование Git и GitHub для контроля версий;
  3. Создание реактивных аналитических веб-приложений на Python (статья).

R

Разработка программного обеспечения на R (ниже перечислены отдельные курсы, входящие в состав программы по обучению разработке программного обеспечения на языке R).

  1. Программное окружение и R;
  2. Продвинутый уровень написания программ на R;
  3. Сборка пакетов на R;
  4. Сборка инструментов визуализации данных.

Дополнительные материалы

  1. Введенние в Hadoop и MapReduce;
  2. Python как инструмент доступа к веб-данным.

Не обязательно пытаться освоить всё и сразу. Есть мнение, что для Data Scientist’a достаточно знать только Python, а без R можно обойтись. Другие считают наоборот. В любом случае, пробуйте, выбирайте то, что вам ближе и у вас несомненно всё получится.

Чтение по теме: Как создать Data Science портфолио

Подобрали три теста для вас:
— А здесь можно применить блокчейн?
Серверы для котиков: выберите лучшее решение для проекта и проверьте себя.
Сложный тест по C# — проверьте свои знания.

Также рекомендуем: