X

Подборка полезных материалов по машинному обучению (не для малышей)

Виктор Кантор, программный директор Академии больших данных MADE

Машинное обучение — это часть Data Science, посвящённая решению задач прогнозирования или поиска структуры в данных. Зачастую, когда говорят про Data Science или про Artificial Intelligence, имеют ввиду именно Machine Learning.

В этой подборке мы приводим книги и курсы, которые позволят погрузиться в мир машинного обучения.

Книги

Нестареющая классика

Первая книга чуть проще в освоении, вторая уже для любителей окунуться в тему с головой. Обе очень требовательны к знаниям по математике и представляют собой классические университетские учебники.

«Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition»

Trevor Hastie, Robert Tibshirani, Jerome Friedman

Февраль 2009

«Pattern Recognition and Machine Learning»

Cristopher Bishop

Springer, 2006

Пара современных и интересных талмудов от MIT Press

Да-да, издательства того самого Массачусетского Технологического. Первая книга тоже даст понять, что математика в университете зачем-то всё же была нужна, но в ней также есть напоминание основ теории вероятностей. Вторая книга — одна из самых современных по глубокому обучению, той части машинного обучения, которая касается глубоких нейросетей. Но область так быстро развивается, что в ней уже нет ни одного последнего достижения Deep Learning.

«Machine Learning: a Probabilistic Perspective»

Kevin Murphy

MIT Press, 2012

«Deep Learning» (также известная как «Deep Learning Book»)

Ian Goodfellow, Yoshua Bengio, Aaron Courville

MIT Press, 2016

Простые и легко читаемые книги с примерами

Эти книги не сделают вас специалистом в машинном обучении, но «человеческим языком» познакомят с основами и покажут примеры использования. Очень подходят для первого знакомства с темой, особенно когда у вас есть бэкграунд программиста.

«Machine Learning in Action»

Peter Harrington

Апрель 2012

«Building Machine Learning Systems with Python»

Willi Richert, Luis Pedro Coelho

Нестареющая классика посложнее

Эти книги сложно назвать «мастхэвом» в списке для чтения: большинство специалистов знакомится с их содержанием на практике. Однако эти книги могут сэкономить вам время на изобретение каких-то велосипедов и познакомить с классическими методами распознавания речи, обработки текстов и информационного поиска. Нужно ли это в эпоху господства нейросетей — решать вам.

«Speech and Language Processing»

Dan Jurafsky, James H. Martin

2009

«Foundations of Statistical Natural Language Processing»

Chris Manning, Hinrich Schütze

«Introduction to Information Retrieval»

Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze

Прим. автора У последней книги есть перевод: «Введение в информационный поиск», 2011.

Пара недооценённых, но неплохих книг

Первая книга написана в 1976 году. И только подумайте: её содержание в значительной степени пересекается с лекциями К. В. Воронцова. Многое было известно уже тогда. Кроме того, эта книга была одной из первых переведённых на русский язык книг по машинному обучению, многие понятия на русском языке были введены именно здесь. Тем, кто уже увлекся машинным обучением, будет определённо интересно с ней познакомиться. Но начинать с неё, конечно, не стоит.

Вторая книга — это рассказ о нейросетях непосредственно перед «бумом» глубокого обучения. Тоже очень отрезвляющая вещь — позволяет понять, что многое, что сейчас кажется современным и придуманным только что, имеет более долгую историю.

«Распознавание образов и анализ сцен»

Дуда Р., Харт П.

1976

«Нейронные сети: полный курс, 2-е издание»

Саймон Хайкин

Вильямс, 2008

Курсы

Преподавание машинного обучения в России как правило связывают с курсом К. В. Воронцова, т. к. курс существует очень давно и на нём было воспитано не одно поколение специалистов по машинному обучению. Материалы оригинального курса можно найти по ссылке. Высшая Школа Экономики выпустила также краткую онлайн-версию этого курса на Курсере.

Если вы не обладаете хорошей математической базой или успели её забыть, изложение в предыдущем курсе будет даваться непросто. В этом случае вам, возможно, больше подойдёт специализация «Машинное обучение и анализ данных» от МФТИ. Её особенность в том, что в первом курсе слушателю напоминают основные моменты из линейной алгебры, математического анализа и теории вероятностей и немного знакомят с библиотеками для анализа данных на Python. Предполагается, что техническое образование у вас уже когда-то было или получается вами сейчас.

Лекции на Coursera, как обычно, можно послушать бесплатно, но полный набор заданий доступен только при подписке. Если вы хотите полностью бесплатный курс, в офлайне есть курс Data Mining in Action, а в онлайне есть курс машинного обучения от сообщества Open Data Science.

Что дальше

Если вы уже немного познакомились с машинным обучением, то как раз для вас Mail.ru Group запускает новый образовательный проект, рассчитанный на специалистов с опытом работы 1–3 года, — Академию больших данных MADE. В Академии можно выбрать очную или дистанционную форму обучения, а также одну из трёх специальностей: Data Scientist, Machine Learning Engineer или Data Engineer. Обучение будет полностью бесплатным, но чтобы поступить, участникам придётся пройти непростой отбор.

Заявку на поступление в ближайший набор Академии больших данных можно подать до 15 сентября.

Также рекомендуем:

Рубрика: Подборки