Питон
Парсинг твитов с использованием Python

Сегодня я покажу вам, как мы можем парсить твиты с помощью одной из библиотек на Python, называемой snscrape.
Результаты
Настройка окружения
Примеры
- Получить все твиты от определенного пользователя.
snscrape twitter-user <twitter_username>- Получить последние 100 твитов с хэштегом #covid19.
snscrape --max-results 100 twitter-hashtag covid19- Получить последние 100 твитов с хэштегом #covid19:
snscrape --jsonl --progress --max-results 100 --since 2020-06-01 twitter-hashtag "relax until:2020-07-01" > text-query-tweets.jsonИспользование
--jsonlдля получения вывода в формате JSONL. Это включает всю информацию, извлеченную с помощью парсера (например, содержимое сообщения, дата и время, изображения; подробности могут отличаться в зависимости от модуля и парсера).--with-entityдля получения информации о сущности, которая парсится, например, о пользователе или канале. Это не поддерживается всеми парсерами. (Вы можете использовать это вместе с--max-results 0, чтобы получить только информацию о сущности.)--formatдля настройки формата вывода.snscrape --helpилиsnscrape <module> --helpпредоставляет подробную информацию о доступных опциях.snscrape --helpтакже перечисляет все доступные модули.
References
Об авторе:
Эта статья написана Ханом Шенгом, техническим руководителем в Arkmind, Малайзия. У него есть страсть к разработке программного обеспечения/архитектуре, компьютерному зрению и также к устройствам Edge. Он создал несколько веб- и мобильных приложений на основе искусственного интеллекта, чтобы помочь клиентам решать реальные проблемы. Не стесняйтесь ознакомиться с его профилем на Github.
