#100DaysofCode День 3: Парсер Twitter
Table Of Content
Мне начинает нравиться написание этих небольших скриптов на Python. Из-за своего загруженного графика, это, вероятно, будет единственный тип задач #100DaysofCode, которые я буду выполнять в ближайшее время.
Сегодня мы рассмотрим простой парсер Twitter, написанный на Python. Для этого парсера используется очень простая библиотека для парсинга Twitter - GetOldTweets3. Эта библиотека предоставляет базовую функциональность парсинга без необходимости использовать собственные ключи API Twitter, что идеально подходит, когда вам не нужна дополнительная информация, а только данные о твитах.
Сначала мы устанавливаем пакет GetOldTweets3 для Python с помощью команды pip:
pip install getoldtweets3
Затем мы открываем файл с помощью встроенного обработчика файлов в Python - open(). Мы также обрабатываем ввод, который будет использоваться в качестве критериев поиска. Критерии поиска создаются с помощью метода tweetCriteria() из GetOldTweets3 и имеют несколько методов, которые можно объединить, чтобы добавить больше параметров поиска для создания запроса. Метод setMaxTweets() принимает максимальное количество твитов для отображения (в настоящее время установлено на 100).
Поиск обрабатывается с помощью метода getTweets() из класса TweetManager, который принимает критерии поиска и возвращает твиты в виде объекта. Затем мы извлекаем нужные нам данные из объекта и сохраняем их в список. Этот список затем записывается в ранее открытый файл для сохранения. Наконец, файл закрывается и скрипт завершается.
Полный исходный код можно найти в моем репозитории #100DaysofCode на Github.