ПАРСИНГ Tokopedia

Table Of Content
В этой статье я поделюсь информацией о том, как парсить данные с одного из веб-сайтов электронной коммерции - Tokopedia. Для объяснения самого парсинга можно посмотреть предыдущую статью о том, как парсить веб-сайты электронной коммерции с помощью Python. Прежде чем перейти к парсингу данных, давайте прочитаем файл требований для парсинга в формате pip3 -r requirements.txt. Здесь мы используем pip3, потому что я использую версию Python 3, для версии 3 и ниже можно использовать просто pip.


После этого мы нажимаем ENTER и процесс будет обработан, как показано на следующем изображении.


Следующий шаг - это парсинг данных, вводим формат scrapy crawl promo -o result_promo.json, чтобы получить файл json.



После получения файла json мы можем проанализировать его с помощью инструментов, доступных в Python, таких как pandas. Для этого сначала нам нужно установить pandas, введя формат pip3 install pandas.

Дальнейшие шаги можно увидеть в предыдущей статье. Для отображения файла будут получены следующие файлы.

Хорошо, если у вас есть какие-либо вопросы, вы можете задать их в комментариях. Вот и все.