Python [Udemy] [Anna Kuzina] Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4. (2021)

Алан-э-Дейл
Алан-э-Дейл

Алан-э-Дейл

Редактор
badge 3 года с нами! badge Награда за 5000 очков репутации badge За шикарный аватар! badge 2FA подключил - Награду получил!
Регистрация
25/03/2020
Сообщения
11.369
Репутация
6.956
  • 1
  • #1
Автор: Udemy
Название: [Anna Kuzina] Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4. (2021)

[Udemy] [Anna Kuzina] Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4. (2021)


Описание:
Этот курс предназначен для тех, кто хочет научиться автоматизированному сбору информации с различных сайтов, то есть парсингу. Для прохождения курса требуются базовые знания питона.

На лекциях будут рассмотрены основные подходы к сбору данных с использованием таких библиотек, как requests, beautifulsoup4 и splash, а также фреймворков Scrapy и Selenium.

В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.

Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.

После прохождения курса студенты будут знать:
  • Как найти и установить необходимые библиотеки для парсинга данных.
  • Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.
  • Для чего нужен файл robots.txt.
  • Каким образом получать HTML сайта для извлечения необходимой информации.
  • Как пользоваться xpath для указания точного расположения элементов на странице.
  • Как переходить по страницам на многостраничном сайте.
  • Как создавать проект и запускать «пауков» Scrapy.
  • Как парсить всю информацию о каждом товаре на сайте.
  • Как осуществлять переход на страницу каждого товара.
  • Каким образом парсить сайты, использующие JavaScript при загрузке.
  • Как авторизовываться на сайте, используя фреймворк Selenium.
  • Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.

Подробнее:
Авторизуйтесь, чтобы посмотреть скрытый контент.

Скачать:
Авторизуйтесь, чтобы посмотреть скрытый контент.
 

Отзывов в теме: 1

1. Качество звука и видео - нормально.
2. У курса нету никаких преимуществ. Проще с ютюба на те же темы посмотреть.
3. Она ничего не объясняет. Просто "я пищу, а вы повторяйте за мной". Банальный пример: для bs4 есть парсер lxml, который быстрее встроенного, а про заголовки запроса (header) вообще не слова, а по нему, большинство парсеров и блокируют.

Общий вывод: не трате свое время
 

Не для новичков. Объясняет понятно, но есть сложные момент которые самому никак не разобрать, а она почему то их опустила.
 
Что за моменты? можете привести пример?
Лично для меня оказался сложный третий урок "Парсинг сайтов с помощью Scrapy" . Увы, одной минуты 39 секунд маловато чтобы понять как его установить и начать с ним работать. Так же нет уже готового кода, что было бы очень кстати.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Последние темы автора

Алан-э-Дейл
Ответы
5
Просмотры
7K
meow_meow
Алан-э-Дейл
Ответы
1
Просмотры
11K
VIT1103
VIT1103
Алан-э-Дейл
Ответы
2
Просмотры
5K
Captain Sparrow
Captain Sparrow
Алан-э-Дейл
Ответы
3
Просмотры
8K
Lora81
Lora81

Похожие темы

Малыш Джон
Ответы
9
Просмотры
10K
AndryAlnor
Малыш Джон
Ответы
5
Просмотры
5K
Muskatt
Muskatt
Алан-э-Дейл
Ответы
0
Просмотры
3K
Алан-э-Дейл
Алан-э-Дейл
Малыш Джон
Ответы
6
Просмотры
4K
sheriden
Дева Мэриан
Ответы
0
Просмотры
1K
Дева Мэриан
Дева Мэриан
Алан-э-Дейл
Ответы
3
Просмотры
9K
karischaster
karischaster
Брат Тук
Ответы
3
Просмотры
2K
Дева Мэриан
Дева Мэриан
Брат Тук
Ответы
1
Просмотры
1K
Els i El
Малыш Джон
Ответы
0
Просмотры
2K
Малыш Джон
Малыш Джон
Сверху Снизу