Парсинг данных с веб-сайта с использованием BeautifulSoup и Requests в Python
Table Of Content
В предыдущей статье мы уже изучили парсинг данных на локальном сервере / localhost. Теперь мы научимся применять это к реальному веб-сайту. В качестве примера мы будем парсить веб-сайт https://www.binance.me/en.
Шаг первый - посетим этот веб-сайт.
Затем мы определяем, какие данные мы хотим спарсить. Допустим, мы хотим спарсить заголовок Buy & sell Crypto in minutes. Мы выделяем нужную нам часть и нажимаем правую кнопку мыши, выбираем "Inspect element".
Здесь мы видим, что заголовок находится в теге div с классом ”css-1obdq75".
Создайте новый файл Python с именем binance.py.
Код будет похож на предыдущую статью.
Здесь мы отправляем запрос на веб-сайт binance.me/en с помощью пакета requests в Python, а затем создаем переменную "scrap", в которую помещаем результат поиска с помощью BeautifulSoup div с классом ”css-1obdq75". Затем запускаем его с помощью команды:
Python3 binance.py
И вот результат:
Если вы видите текст, который мы спарсили с веб-сайта, значит процесс парсинга веб-сайта удался.
Надеюсь, это было полезно...
Спасибо