Обложка: Набор инструментов, чтобы сделать аналитику на R максимально комфортной

Набор инструментов, чтобы сделать аналитику на R максимально комфортной

4
Елизавета Рузова
Елизавета Рузова

аналитик и эксперт в IT Resume

Аналитика — процесс достаточно трудоемкий и творческий, в каком-то плане. В реальных задачах ответ не всегда лежит на поверхности, а чтобы его разглядеть, порой приходится сильно прищуриться. Для этого у аналитика должны быть удобные инструменты на любой случай жизни. Только тогда он сможет абстрагироваться от внешних раздражителей и увидеть нечто важное.

Мы с ребятами из IT Resume любим использовать язык R для аналитики. Конечно, Python тоже активно используем, но есть в R что-то притягивающее, из-за чего хочется использовать его снова и снова. Сегодня мы вам расскажем, какие инструменты мы используем, чтобы сделать весь процесс работы с языком R максимально комфортным.

IDE — всему голова

Первое, что необходимо любому разработчику и аналитику — IDE или среда для разработки. И здесь абсолютным лидером является RStudio.

Это очень удобная (и визуально приятная, кстати) программа, в которой Вы можете:

  • писать код;
  • следить за его выполнением;
  • исследовать все объекты и переменные;
  • строить графики;
  • многое другое.

Кстати говоря, совсем недавно вышла новая версия и туда завезли много классных штук. Например:

  • улучшенная поддержка Python (так что можно не только с R работать) ;
  • выпадающая командная строка;
  • радужные скобки (чтобы удобней было работать с циклами и функциями).

Облачный RStudio Cloud

Еще одна классная вещь (хотя, по сути, то же самое) — RStudio Cloud.

Это облачная версия уже известной Вам RStudio, у которой есть ряд очевидных преимуществ:

  • одновременно может работать целая команда;
  • не надо устанавливать софт и библиотеки на свой компьютер;
  • все проекты хранятся в облаке, что безопасно.

А бывает еще такая ситуация: Вам нужно показать что-то срочно с чужого компьютера, где нет ни языка R, ни RStudio. Тогда Вы просто открываете свой аккаунт RStudio Cloud, заходите в нужный проект и дело сделано.

R Markdown для текстов и не только

R Markdown — это фреймворк для создания публикаций, отчетов и исследований для специалистов в области аналитики и Data Science.

Мы специально выделили R Markdown в отдельный пункт, потому что Вы его реально будете использовать как абсолютно отдельный инструмент. Вот примерный список того, что Вы можете делать:

  • Вы можете писать код, строить графики, делать вычисления и сразу смотреть за результатом. Все как Jupyter в Python. Только здесь все это сразу попадет в Ваш итоговый отчет — вам не нужно будет делать двойную работу.
  • Вы можете писать и форматировать текст с помощью markdown разметки, а также добавлять инлайновый код (строку кода на языке R, которая сразу будет вычислена).
  • Вы можете писать формулы, поддерживается весь основной синтаксис (по сути, стандартные формулы Latex).
  • В конце Вы можете экспортировать свои результаты в разных форматах (html, pdf, docx), а также сделать из них полноценные сайты и книги!

Т.е. вам нет необходимости проводить какой-то анализ или строить модель, а только потом приступать к написанию ответа. Вы можете выполнять и редактировать свой код прямо в документах R Markdown.

Кстати говоря, в последнем обновлении в R Markdown завезли визуальный редактор (WYSIWYG — what you see is what you get), т.е. вы можете видеть отформатированный код прямо во время его набора.

Еще из интересного: вы можете не только писать отчеты для руководства и научные статьи, но и делать презентации или строить дашборды. Да, R Markdown умеет переводить ваши труды и в эти форматы! Вот так это будет выглядеть:

R Shiny для веб-приложений

Еще один фреймворк, о котором стоит упомянуть отдельно — R Shiny.

Это библиотека, которая позволяет создавать интерактивные веб-приложения с помощью языка R. Но по факту это реально цельный инструмент, поэтому мы его вынесли отдельным пунктом.

Порой бывает очень удобно: вот вы написали какой-то обработчик данных, а затем опубликовали (задеплоили) его в интернет, чтобы Ваши коллеги могли им пользоваться. Ну или вообще написали какой-то сервис для широкой аудитории — например, чтобы все могли быстренько делать регрессионный анализ. Чем не pet project 🙂 Вот для таких вещей и нужен R Shiny.

С помощью этого фреймворка у аналитиков и разработчиков есть возможность отдельно настроить всю серверную часть: какие модели должны быть, как они должны работать, какие ошибки возвращать, в каком виде результат отдавать и так далее. По аналогии настраиваем интерфейс: кнопочки, переключатели, ползунки, внешний вид и так далее. На выходе получаем красоту, которая еще и работает!

Устрой деплой!

Так, веб-приложения создавать мы можем, а куда их деплоить? Спокойно, все продумано.

Shinyapps.io — коммьюнити языка R сами предлагают нам решение. Это облачные сервера, на которые мы бесплатно можем разместить несколько своих веб-приложений. Там нам доступен мониторинг и управление из простого и удобного интерфейса.

Существуют также платные версии — на них вы можете перейти, и тогда вам будут доступны премиальные возможности: большее количество приложений, увеличенная мощность, подключение собственного домена и так далее.

Однако, если это проект для внутреннего пользования или даже для небольшой компании — подойдет и бесплатный тариф.

Эпилог

Мы с вами рассмотрели 5 инструментов, которые вам наверняка пригодятся, если вы будете заниматься Data Science и аналитикой на языке R.

Вы могли заметить, что в этом перечне все достаточно компактно — нет огромного количества сайтов, программ и специальных утилит. Да, это действительно так: разработчики языка и софта постарались сделать все максимально удобно и нам просто нет потребности скакать между программами, все и так под рукой. Нужно писать код — R Studio. Нужно писать научную диссертацию на основании исследования — R Markdown в R Studio. И это касается всего — им удалось создать цельную экосистему, в которой очень комфортно чувствует себя любой специалист.

Хинт для программистов: если зарегистрируетесь на соревнования Huawei Cup, то бесплатно получите доступ к онлайн-школе для участников. Можно прокачаться по разным навыкам и выиграть призы в самом соревновании.

Перейти к регистрации

Что думаете?