План обучения для специалиста по Data Science
Детальный пошаговый план обучения по специальности Data Sientist. Если вы хотели стать спциалистом по Data Science, но не знали, с чего начать.
44К открытий45К показов
Благодаря Data Science мы можем контролировать взлёты и посадки в самых больших аэропортах, можем анализировать и прогнозировать появление эпидемий без врачей. Благодаря не только современной технике, но и тем обученным программам, которые в ней установлены, доктора могут практически безошибочно ставить сложные диагнозы в некоторых отраслях медицины. Более того, у нас даже есть беспилотный транспорт и с каждым годом он лучше и умнее! Предлагаем вам не оставаться в стороне от такой интересной и перспективной науки и стать на сторону её развития.
Примечание У нас есть планы обучения и по другим специальностям.
Базовый (связующий модуль)
- CS50 — курс Гарварда по программированию. Рассматривается построение алгоритмов, поиск наиболее эффективных методов решения проблемы. Также присутствует практика на языках C, Python и JavaScript;
- Математика и информатика;Зачем программисту нужна информатика?
- Освоение программирования по программе «Nanodegree — Learn to Code» от Udacity.
Зачем нужен этот модуль?
Если вы пришли в программирование из другой специальности или же были верстальщиком или веб-дизайнером, то этот модуль поможет расширить границы ваших познаний в программировании.
Ядро науки о данных
Программа дополнительного образования от Udacity «DataAnalyst» (платно и на английском).
Если у вас есть желание подстроить программу образования под себя, то это будет бесплатно. Предлагаем следующую последовательность бесплатных курсов, входящих в программу выше:
- Введение в инференциальную статистику;
- Введение в описательную статистику;
- Введение в аналитическую обработку данных (с применением NumPy и Pandas);
- Введение в первичную обработку данных;
- SQL для аналитической обработки данных;
- MongoDB для аналитической обработки данных (при возможности и желании можно изучить аналитическую обработку данных с помощью языка R.);
- Введение в Машинное обучение;
- Визуализация данных и работа с D3.js;
- A/B тестирование.
Дополнительные курсы на русском языке
- Введение в базы данных (при возможности и желании можно изучить анализ данных в R [первая и вторая части]);
- СУБД;
- Алгоритмы и структуры данных;
- Методы обработки больших данных.
Машинное обучение
- Введение в машинное обучение;
- Обучение работе с TensorFlow с применением в реальных приложениях;
- Машинное обучение и масштабирование;
- Нейронные сети и машинное обучение.
Разработка программного обеспечения
Python
- Тестирование и отладка;
- Использование Git и GitHub для контроля версий;
- Создание реактивных аналитических веб-приложений на Python (статья).
R
Разработка программного обеспечения на R (ниже перечислены отдельные курсы, входящие в состав программы по обучению разработке программного обеспечения на языке R).
- Программное окружение и R;
- Продвинутый уровень написания программ на R;
- Сборка пакетов на R;
- Сборка инструментов визуализации данных.
Дополнительные материалы
Не обязательно пытаться освоить всё и сразу. Есть мнение, что для Data Scientist’a достаточно знать только Python, а без R можно обойтись. Другие считают наоборот. В любом случае, пробуйте, выбирайте то, что вам ближе и у вас несомненно всё получится.
Чтение по теме: Как создать Data Science портфолио
44К открытий45К показов