Парсинг данных с Twitter и Youtube (python)
Table Of Content
Парсинг - это процесс извлечения данных с веб-сайта. В связи с развитием больших данных, количество доступных данных стало несметным. Парсинг позволяет собирать данные быстрее, так как он может выполнять автоматизацию.
(1) Существует много способов получить данные (парсинг) с Twitter.
a. Использование API Twitter (Рекомендуется использовать API, доступ к парсингу можно получить здесь)
b. Без использования API Twitter. Я часто использую GetOldTweets и Twitterscraper.
Для парсинга данных из социальных медиа необходимо установить несколько библиотек. Вот шаги для установки библиотек в Python и пример получения данных с определенным ключевым словом.
Результат будет выглядеть следующим образом:
Далее, если требуется получить данные с несколькими ключевыми словами одновременно.
Хотите сосредоточиться только на определенном аккаунте? Вот скрипт, который можно попробовать.
О, оказывается, хочется получить данные сразу нескольких аккаунтов.
Затем, когда вы уверены в данных и хотите сохранить их (измените параметры по необходимости).
- Twitterscraper (нажмите здесь)Подсказка: не более 5 минут для попробовать, очень просто, подходит для работы только с ключевыми словами.
Оба варианта можно попробовать, какой лучше? Выбирайте в зависимости от использования и потребностей :)
(2) Парсинг Youtube
Да, данные с этой видео-платформы также могут быть получены. Это комментарии к видео. Комментарии в видео на Youtube считаются интересными и важными. Способы парсинга комментариев на Youtube постоянно улучшаются. Один из способов, которым я пользуюсь для парсинга комментариев на Youtube, - это YouTube Comment Scraper (разработка продолжается, но веб-сайт можно найти здесь, а инструкции по использованию можно найти здесь)
Вот немного информации от меня, надеюсь, что помогло (ссылки на источники)