Парсинг данных Reddit-постов с использованием PRAW - пакета Python.
Введение
PRAW (Python Reddit API Wrapper) - это пакет Python, который помогает нам парсить данные Reddit-постов с использованием API Reddit. Он очень прост в использовании для сбора данных о постах Reddit (посты Reddit обычно называются "submission") и, следовательно, для выполнения различных задач, таких как анализ настроений.
Здесь я расскажу вам о очень простом подходе, с помощью которого вы можете настроить и установить PRAW и работать с ним.
Предварительные требования
- Знание Python
- Учетная запись Reddit и понимание ее работы
- Секретные ключи API
Шаг 1:
Сначала создайте учетную запись Reddit. Затем нажмите на выпадающее меню рядом с вашим именем профиля в правом верхнем углу. Нажмите на "Посетить старый Reddit" и затем на "Настройки" в правом верхнем углу. Затем выберите вкладку "Приложения" и оттуда вы получите возможность создать вкладку, выберите ее.
Шаг 2:
Введите имя вашего приложения, выберите меню скриптов и дайте описание в поле описания. Вы можете оставить поле "URL о приложении", но вам нужно заполнить "URI перенаправления". Введите "http://localhost:8080" в разделе URI перенаправления и нажмите вкладку "Создать приложение".
Шаг 3:
После выбора вкладки "Создать приложение" вы получите два ключа (см. изображение ниже). Тот, помеченный 1, является client_id, который состоит из 14 символов, а тот, помеченный 2, является client_secret, который состоит из 27 символов. Запишите их.
Шаг 4:
Установите PRAW, используя pip install praw из командной строки Anaconda. Затем обратитесь к репозиторию GitHub https://github.com/diptaraj23/Scraping-Reddit-post-data-using-PRAW, чтобы получить подробное понимание о том, как работать с ним.