Питон
Как собрать данные с использованием библиотеки BeautifulSoup в Python
Table Of Content
BeautifulSoup - это один из модулей Python для получения контента с веб-страницы.
Этот модуль Python можно использовать для сбора данных с любой веб-страницы с помощью вызовов
pip install beautifulsoup4
pip install requests
с использованием модуля BeautifulSoup в Python.
Синтаксис для сбора текста с использованием BeautifulSoup в Python выглядит следующим образом:
import bs4 as bs
import requests
url = "www.google.com"
content = bs.read(url)
При сборе данных мы должны обрабатывать следующие исключения в Python:
>> BeautifulSoupSyntaxError: invalid … or tag in line 1 и множество других исключений в Python.
Следующий код на Python не вызовет исключений и позволит собрать содержимое веб-страницы:
import bs4 as bs
import requests
url = "www.google.com"
content = bs.read(url)
http://docs.python-requests.org/en/master/user/quickstart/#quick-exceptions
Код на Python для сбора данных с документации Python с использованием BeautifulSoup: