Набор инструментов, чтобы сделать аналитику на R максимально комфортной
Инструменты, которые наверняка пригодятся, если вы будете заниматься Data Science и аналитикой на языке R.
1К открытий2К показов
Елизавета Рузова
аналитик и эксперт в IT Resume
Аналитика — процесс достаточно трудоемкий и творческий, в каком-то плане. В реальных задачах ответ не всегда лежит на поверхности, а чтобы его разглядеть, порой приходится сильно прищуриться. Для этого у аналитика должны быть удобные инструменты на любой случай жизни. Только тогда он сможет абстрагироваться от внешних раздражителей и увидеть нечто важное.
Мы с ребятами из IT Resume любим использовать язык R для аналитики. Конечно, Python тоже активно используем, но есть в R что-то притягивающее, из-за чего хочется использовать его снова и снова. Сегодня мы вам расскажем, какие инструменты мы используем, чтобы сделать весь процесс работы с языком R максимально комфортным.
IDE — всему голова
Первое, что необходимо любому разработчику и аналитику — IDE или среда для разработки. И здесь абсолютным лидером является RStudio.
Это очень удобная (и визуально приятная, кстати) программа, в которой Вы можете:
- писать код;
- следить за его выполнением;
- исследовать все объекты и переменные;
- строить графики;
- многое другое.
Кстати говоря, совсем недавно вышла новая версия и туда завезли много классных штук. Например:
- улучшенная поддержка Python (так что можно не только с R работать) ;
- выпадающая командная строка;
- радужные скобки (чтобы удобней было работать с циклами и функциями).
Облачный RStudio Cloud
Еще одна классная вещь (хотя, по сути, то же самое) — RStudio Cloud.
Это облачная версия уже известной Вам RStudio, у которой есть ряд очевидных преимуществ:
- одновременно может работать целая команда;
- не надо устанавливать софт и библиотеки на свой компьютер;
- все проекты хранятся в облаке, что безопасно.
А бывает еще такая ситуация: Вам нужно показать что-то срочно с чужого компьютера, где нет ни языка R, ни RStudio. Тогда Вы просто открываете свой аккаунт RStudio Cloud, заходите в нужный проект и дело сделано.
R Markdown для текстов и не только
R Markdown — это фреймворк для создания публикаций, отчетов и исследований для специалистов в области аналитики и Data Science.
Мы специально выделили R Markdown в отдельный пункт, потому что Вы его реально будете использовать как абсолютно отдельный инструмент. Вот примерный список того, что Вы можете делать:
- Вы можете писать код, строить графики, делать вычисления и сразу смотреть за результатом. Все как Jupyter в Python. Только здесь все это сразу попадет в Ваш итоговый отчет – вам не нужно будет делать двойную работу.
- Вы можете писать и форматировать текст с помощью markdown разметки, а также добавлять инлайновый код (строку кода на языке R, которая сразу будет вычислена).
- Вы можете писать формулы, поддерживается весь основной синтаксис (по сути, стандартные формулы Latex).
- В конце Вы можете экспортировать свои результаты в разных форматах (html, pdf, docx), а также сделать из них полноценные сайты и книги!
Т.е. вам нет необходимости проводить какой-то анализ или строить модель, а только потом приступать к написанию ответа. Вы можете выполнять и редактировать свой код прямо в документах R Markdown.
Кстати говоря, в последнем обновлении в R Markdown завезли визуальный редактор (WYSIWYG — what you see is what you get), т.е. вы можете видеть отформатированный код прямо во время его набора.
Еще из интересного: вы можете не только писать отчеты для руководства и научные статьи, но и делать презентации или строить дашборды. Да, R Markdown умеет переводить ваши труды и в эти форматы! Вот так это будет выглядеть:
R Shiny для веб-приложений
Еще один фреймворк, о котором стоит упомянуть отдельно — R Shiny.
Это библиотека, которая позволяет создавать интерактивные веб-приложения с помощью языка R. Но по факту это реально цельный инструмент, поэтому мы его вынесли отдельным пунктом.
Порой бывает очень удобно: вот вы написали какой-то обработчик данных, а затем опубликовали (задеплоили) его в интернет, чтобы Ваши коллеги могли им пользоваться. Ну или вообще написали какой-то сервис для широкой аудитории — например, чтобы все могли быстренько делать регрессионный анализ. Чем не pet project ? Вот для таких вещей и нужен R Shiny.
С помощью этого фреймворка у аналитиков и разработчиков есть возможность отдельно настроить всю серверную часть: какие модели должны быть, как они должны работать, какие ошибки возвращать, в каком виде результат отдавать и так далее. По аналогии настраиваем интерфейс: кнопочки, переключатели, ползунки, внешний вид и так далее. На выходе получаем красоту, которая еще и работает!
Устрой деплой!
Так, веб-приложения создавать мы можем, а куда их деплоить? Спокойно, все продумано.
Shinyapps.io — коммьюнити языка R сами предлагают нам решение. Это облачные сервера, на которые мы бесплатно можем разместить несколько своих веб-приложений. Там нам доступен мониторинг и управление из простого и удобного интерфейса.
Существуют также платные версии — на них вы можете перейти, и тогда вам будут доступны премиальные возможности: большее количество приложений, увеличенная мощность, подключение собственного домена и так далее.
Однако, если это проект для внутреннего пользования или даже для небольшой компании — подойдет и бесплатный тариф.
Эпилог
Мы с вами рассмотрели 5 инструментов, которые вам наверняка пригодятся, если вы будете заниматься Data Science и аналитикой на языке R.
Вы могли заметить, что в этом перечне все достаточно компактно — нет огромного количества сайтов, программ и специальных утилит. Да, это действительно так: разработчики языка и софта постарались сделать все максимально удобно и нам просто нет потребности скакать между программами, все и так под рукой. Нужно писать код — R Studio. Нужно писать научную диссертацию на основании исследования — R Markdown в R Studio. И это касается всего — им удалось создать цельную экосистему, в которой очень комфортно чувствует себя любой специалист.
1К открытий2К показов