#100DaysofCode День 3: Парсер Twitter

Мне начинает нравиться написание этих небольших скриптов на Python. Из-за своего загруженного графика, это, вероятно, будет единственный тип задач #100DaysofCode, которые я буду выполнять в ближайшее время.

Сегодня мы рассмотрим простой парсер Twitter, написанный на Python. Для этого парсера используется очень простая библиотека для парсинга Twitter - GetOldTweets3. Эта библиотека предоставляет базовую функциональность парсинга без необходимости использовать собственные ключи API Twitter, что идеально подходит, когда вам не нужна дополнительная информация, а только данные о твитах.

Сначала мы устанавливаем пакет GetOldTweets3 для Python с помощью команды pip:

pip install getoldtweets3

Затем мы открываем файл с помощью встроенного обработчика файлов в Python - open(). Мы также обрабатываем ввод, который будет использоваться в качестве критериев поиска. Критерии поиска создаются с помощью метода tweetCriteria() из GetOldTweets3 и имеют несколько методов, которые можно объединить, чтобы добавить больше параметров поиска для создания запроса. Метод setMaxTweets() принимает максимальное количество твитов для отображения (в настоящее время установлено на 100).

Поиск обрабатывается с помощью метода getTweets() из класса TweetManager, который принимает критерии поиска и возвращает твиты в виде объекта. Затем мы извлекаем нужные нам данные из объекта и сохраняем их в список. Этот список затем записывается в ранее открытый файл для сохранения. Наконец, файл закрывается и скрипт завершается.

Полный исходный код можно найти в моем репозитории #100DaysofCode на Github.