Веб-скрейпинг на Python: запускаем парсинг сайтов за 1 час

Обложка: Веб-скрейпинг на Python: запускаем парсинг сайтов за 1 час

Веб-скрейпинг — это метод автоматизированного извлечения данных с сайтов. С его помощью можно решать разные задачи. Например:

  • отслеживать скидки на определённые товары в интернет-магазинах;
  • сравнивать цены на разных сервисах;
  • ловить низкие цены на авиабилеты.

Вариантов применения намного больше, надо только включить фантазию. Главное, не собирать информацию, защищённую законом, — например, персональные данные пользователей.

В этом видео парсинг на Python реализован с помощью библиотеки Beautiful Soup. Она позволяет собирать информацию с любых ресурсов, будь то социальная сеть, Википедия или интернет-магазин. Библиотека предоставляет методы для навигации, поиска и изменения синтаксического дерева.

Код проекта

01:22 В первой части курса вы изучите концепцию на примере скрейпинга базовой HTML-страницы.

24:48 Во второй части курса научитесь извлекать данные с реального сайта.

1:01:53 Напоследок узнаете, как сохранить собранные данные.

Посмотрите также подборку других инструментов для веб-скрейпинга. Там есть примеры онлайн-сервисов, а также библиотеки для Python, JavaScript и Java.

Хинт для программистов: если зарегистрируетесь на соревнования Huawei Cup, то бесплатно получите доступ к онлайн-школе для участников. Можно прокачаться по разным навыкам и выиграть призы в самом соревновании.

Перейти к регистрации