{"blocks":[{"type":"paragraph","data":{"text":"Изучающий data science сталкивается с огромным разнообразием возможностей. Я хочу поделиться с вами своим топом Python библиотек, которые широко используются в data science."}},{"type":"header2","data":{"level":2,"text":"1. Pandas"}},{"type":"paragraph","data":{"text":"Вы наверняка слышали, что от 70 до 80 процентов работы дата-сайентиста это исследование и подготовка данных."}},{"type":"paragraph","data":{"text":"Pandas в первую очередь применяется для анализа данных, это одна из самых популярных библиотек. Она предоставляет множество полезных инструментов для сбора, очистки и моделирования данных. С Pandas вы можете загружать, подготавливать, анализировать и манипулировать любыми индексированными данными. Библиотеки для машинного обучения также используют датафреймы из Pandas в качестве входных данных."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Туториал на Kaggle","75 вопросов о Pandas","Задачи для изучения Pandas"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"2. NumPy"}},{"type":"paragraph","data":{"text":"Главное преимущество NumPy — поддержка n-размерных массивов. Эти многомерные массивы в 50 раз надёжнее списков в Python. Благодаря им, NumPy очень любят дата-сайентисты."}},{"type":"paragraph","data":{"text":"NumPy часто используют другие библиотеки типа TensorFlow, для внутренних вычислений с тензорами. Библиотека предлагает быстрые универсальные функции для рутинных вычислений, которые сложно делать вручную. NumPy использует функции оптимизированные для работы с многомерными массивами, скорость работы которых сравнима с MATLAB."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["NumPy.org","TutorialsPoint"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"3. Scikit-learn"}},{"type":"paragraph","data":{"text":"Scikit-learn, это возможно самая важная библиотека для машинного обучения на Python. После очистки и манипуляций с данными в Pandas или NumPy, Scikit-learn используется для создания моделей машинного обучения. Библиотека предоставляет множество инструментов для предиктивного моделирования и анализа."}},{"type":"paragraph","data":{"text":"Есть много причин использовать Scikit-learn. Например, для создания нескольких типов моделей машинного обучения, с подкреплением и без подкрепления, перекрестной проверки точности моделей и отбора важных признаков."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Scikit-learn tutorial","An Introduction to Machine Learning (Udacity)"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"4. Gradio"}},{"type":"paragraph","data":{"text":"Gradio позволяет создавать и разворачивать веб-приложения для машинного обучения используя всего лишь несколько строк кода. Он служит тем же целям что и Streamlit, или Flask, но быстрее и проще позволяет разворачивать модели."}},{"type":"paragraph","data":{"text":"Основные плюсы Gradio:"}},{"type":"list","data":{"items":["Даёт возможность дальнейшей валидации модели. Он позволяет проводить интерактивные тесты различных входных данных модели.Это хороший способ для проведения демонстраций.Легко запускать и распространять, потому что веб приложения доступны каждому по ссылке."],"style":"ordered"}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Туториал от разработчиков"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"5. TensorFlow"}},{"type":"paragraph","data":{"text":"TensorFlow — это одна из самых популярных Python библиотек для создания нейронных сетей. Она использует многомерные массивы, также известные как тензоры, которые позволяют производить несколько операций на одних входных данных."}},{"type":"paragraph","data":{"text":"Благодаря своей многопоточной природе, он может одновременно тренировать несколько нейронных сетей и создавать высокоэффективные и масштабируемые модели."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Сайт библиотеки","Введение в глубокое обучение от Kaggle","Туториал от Google"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"6. Keras"}},{"type":"paragraph","data":{"text":"Keras в основном применяют для создания моделей глубокого обучения и нейронных сетей. Он использует TensorFlow и Theano и позволяет легко создавать нейронные сети. Из-за того, что Keras генерирует вычислительный граф на сервере, он немного медленнее других библиотек."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Сайт библиотеки","Туториал от Google"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"7. SciPy"}},{"type":"paragraph","data":{"text":"Отличительная черта этой библиотеки — функции, которые полезны в математике и других науках. Например: статистические функции, функции оптимизации, обработки сигналов. Для решения дифференциальных уравнений и оптимизации он включает в себя функции для нахождения численного решения интегралов. Важные сферы его применения:"}},{"type":"list","data":{"items":["многомерная обработка изображений;","решения преобразований Фурье и дифф. уравнений;","благодаря оптимизированным алгоритмам, он может выполнять вычисления линейной алгебры очень эффективно и с высокой надёжностью."],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"8. Statsmodels"}},{"type":"paragraph","data":{"text":"Statsmodels это отличная библиотека для хардкорной статистики. Она вобрала в себя графические возможности и функции из Matplotlib, для обработки данных использует Pandas, для R подобных формул он использует Pasty, также она использует Numpy и SciPy."}},{"type":"paragraph","data":{"text":"Библиотека используется для создания статистических моделей типа линейной регрессии, и проведения статистических тестов."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Сайт библиотеки"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"9. Plotly"}},{"type":"paragraph","data":{"text":"Plotly это мощный, легкий в использовании инструмент для создания визуализаций, который позволяет с ними взаимодействовать."}},{"type":"paragraph","data":{"text":"Наряду с Plotly существует Dash, который позволяет создавать динамические дэшборды, используя визуализации Plotly. Dash это веб интерфейс для Python, который избавляет от необходимости использовать Js в аналитических веб приложениях, и позволяет запускать их онлайн и офлайн."}},{"type":"paragraph","data":{"text":"Подробнее о визуализации данных с помощью Plotly."}},{"type":"header3","data":{"level":3,"text":"Где учить"}},{"type":"list","data":{"items":["Визуализации для начинающих","Визуализации для продолжающих"],"style":"unordered"}},{"type":"header2","data":{"level":2,"text":"10. Seaborn"}},{"type":"paragraph","data":{"text":"Seaborn — это эффективная Python библиотека для создания различных визуализаций в Data Science, использующая Matplotlib."}},{"type":"paragraph","data":{"text":"Одна из основных её особенностей это визуализация данных, которая позволяет увидеть корреляцию там, где она была не очевидна. Это позволяет дата-сайентистам лучше понимать данные."}},{"type":"paragraph","data":{"text":"Благодаря кастомизируемым темам и высокоуровневым интерфейсам вы можете получать настолько качественные и репрезентативные визуализации, что их в дальнейшем можно показывать клиентам."}},{"type":"header3","data":{"level":3,"text":"Где учить?"}},{"type":"list","data":{"items":["Ультимативный гайд по Seaborn","Гайд на сайте библиотеки"],"style":"unordered"}}]}

Ошибка в настройках сайта