ПАРСИНГ Tokopedia
Table Of Content
В этой статье я поделюсь информацией о том, как парсить данные с одного из веб-сайтов электронной коммерции - Tokopedia. Для объяснения самого парсинга можно посмотреть предыдущую статью о том, как парсить веб-сайты электронной коммерции с помощью Python. Прежде чем перейти к парсингу данных, давайте прочитаем файл требований для парсинга в формате pip3 -r requirements.txt. Здесь мы используем pip3, потому что я использую версию Python 3, для версии 3 и ниже можно использовать просто pip.
После этого мы нажимаем ENTER и процесс будет обработан, как показано на следующем изображении.
Следующий шаг - это парсинг данных, вводим формат scrapy crawl promo -o result_promo.json, чтобы получить файл json.
После получения файла json мы можем проанализировать его с помощью инструментов, доступных в Python, таких как pandas. Для этого сначала нам нужно установить pandas, введя формат pip3 install pandas.
Дальнейшие шаги можно увидеть в предыдущей статье. Для отображения файла будут получены следующие файлы.
Хорошо, если у вас есть какие-либо вопросы, вы можете задать их в комментариях. Вот и все.