Парсинг данных с Tokopedia
Table Of Content
Что такое парсинг?
Парсинг веб-сайтов, также известный как веб-скрапинг или извлечение веб-данных, является процессом извлечения определенных полуструктурированных данных с веб-страницы. _источник: _https://id.wikipedia.org/wiki/Web_scraping
Проще говоря, это извлечение всех данных, отображаемых на веб-сайте. В данном контексте мы извлекаем название продукта, цену продукта, название магазина и местоположение магазина.
Какая польза от этого?
Вы получите все данные (название продукта, цена продукта, название магазина и местоположение магазина), которые можно обработать и использовать для получения полезной информации. Например, вы хотите узнать самую низкую цену на смартфон Redmi Note 11, но есть более 100 различных цен. Это будет сложно найти, не так ли? Так что с помощью данных, полученных в результате парсинга, мы можем найти самую низкую или самую высокую цену с помощью Excel.
Итак, мы знаем, что самая низкая цена составляет Rp. 2.275.000, а самая высокая цена составляет Rp. 4.159.000
Как парсить данные на Tokopedia?
Для этого используйте мое приложение под названием "tokopedia parser".
Шаги:
-
Убедитесь, что у вас установлен браузер Google Chrome.
-
Загрузите chromedriver https://chromedriver.chromium.org/downloads. Соответствуйте версии Google Chrome и chromedriver.
-
Распакуйте tokopedia-parser.zip в папку вместе с chromedriver.
-
Откройте командную строку и введите pip install selenium. Дождитесь завершения процесса.
-
Перетащите файл main.py в командную строку и нажмите Enter. Затем введите название продукта, который вы хотите спарсить.
- Дождитесь завершения процесса. Процесс начинается с автоматического открытия браузера Google Chrome, затем открытия всех страниц, а затем закрытия браузера Google Chrome. Вам не нужно делать ничего до завершения процесса.
Вот и все, способ парсинга данных на Tokopedia с использованием моего приложения. Удачи вам.
О, кстати. Это приложение с открытым исходным кодом, вы можете использовать его и добавлять свои собственные функции бесплатно :)