Подборка полезных материалов по машинному обучению (не для малышей)
Машинное обучение — популярное направление, по которому написано множество книг и курсов. Какие из них полезны и заслуживают внимания? Делимся в статье.
9К открытий9К показов
Виктор Кантор
программный директор Академии больших данных MADE
Машинное обучение — это часть Data Science, посвящённая решению задач прогнозирования или поиска структуры в данных. Зачастую, когда говорят про Data Science или про Artificial Intelligence, имеют ввиду именно Machine Learning.
В этой подборке мы приводим книги и курсы, которые позволят погрузиться в мир машинного обучения.
Книги
Нестареющая классика
Первая книга чуть проще в освоении, вторая уже для любителей окунуться в тему с головой. Обе очень требовательны к знаниям по математике и представляют собой классические университетские учебники.
- Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition;
- Pattern Recognition and Machine Learning.
Пара современных и интересных талмудов от MIT Press
Да-да, издательства того самого Массачусетского Технологического. Первая книга тоже даст понять, что математика в университете зачем-то всё же была нужна, но в ней также есть напоминание основ теории вероятностей. Вторая книга — одна из самых современных по глубокому обучению, той части машинного обучения, которая касается глубоких нейросетей. Но область так быстро развивается, что в ней уже нет ни одного последнего достижения Deep Learning.
- Machine Learning: a Probabilistic Perspective;
- Deep Learning (также известная как Deep Learning Book).
Простые и легко читаемые книги с примерами
Эти книги не сделают вас специалистом в машинном обучении, но «человеческим языком» познакомят с основами и покажут примеры использования. Очень подходят для первого знакомства с темой, особенно когда у вас есть бэкграунд программиста.
- Machine Learning in Action;
- Building Machine Learning Systems with Python.
Нестареющая классика посложнее
Эти книги сложно назвать «мастхэвом» в списке для чтения: большинство специалистов знакомится с их содержанием на практике. Однако эти книги могут сэкономить вам время на изобретение каких-то велосипедов и познакомить с классическими методами распознавания речи, обработки текстов и информационного поиска. Нужно ли это в эпоху господства нейросетей — решать вам.
- Speech and Language Processing;
- Foundations of Statistical Natural Language Processing;
- Introduction to Information Retrieval (у нее есть перевод: «Введение в информационный поиск», 2011).
Пара недооценённых, но неплохих книг
Первая книга написана в 1976 году. И только подумайте: её содержание в значительной степени пересекается с лекциями К. В. Воронцова. Многое было известно уже тогда. Кроме того, эта книга была одной из первых переведённых на русский язык книг по машинному обучению, многие понятия на русском языке были введены именно здесь. Тем, кто уже увлекся машинным обучением, будет определённо интересно с ней познакомиться. Но начинать с неё, конечно, не стоит.
Вторая книга — это рассказ о нейросетях непосредственно перед «бумом» глубокого обучения. Тоже очень отрезвляющая вещь — позволяет понять, что многое, что сейчас кажется современным и придуманным только что, имеет более долгую историю.
- «Распознавание образов и анализ сцен»;
- «Нейронные сети: полный курс», 2-е издание.
Курсы
Преподавание машинного обучения в России как правило связывают с курсом К. В. Воронцова, т. к. курс существует очень давно и на нём было воспитано не одно поколение специалистов по машинному обучению. Материалы оригинального курса можно найти по ссылке. Высшая Школа Экономики выпустила также краткую онлайн-версию этого курса на Курсере.
Если вы не обладаете хорошей математической базой или успели её забыть, изложение в предыдущем курсе будет даваться непросто. В этом случае вам, возможно, больше подойдёт специализация «Машинное обучение и анализ данных» от МФТИ. Её особенность в том, что в первом курсе слушателю напоминают основные моменты из линейной алгебры, математического анализа и теории вероятностей и немного знакомят с библиотеками для анализа данных на Python. Предполагается, что техническое образование у вас уже когда-то было или получается вами сейчас.
Лекции на Coursera, как обычно, можно послушать бесплатно, но полный набор заданий доступен только при подписке. Если вы хотите полностью бесплатный курс, в офлайне есть курс Data Mining in Action, а в онлайне есть курс машинного обучения от сообщества Open Data Science.
9К открытий9К показов