Извлечение данных из страниц и групп Facebook с помощью Python
Table Of Content
- kevinzg/facebook-scraper
- Парсинг публичных страниц Facebook без использования ключа API. Внесите свой вклад в развитие kevinzg/facebook-scraper, создав...
- kemaleb - Обзор
- Отклонить Регистрация на собственный профиль на GitHub, лучшем месте для размещения кода, управления проектами и создания программного...
В этой статье мы познакомимся с библиотекой facebook-scraper, давайте начнем.
Сначала давайте ответим на вопрос, почему мы не используем Facebook Graph API?
Graph API - это API, который позволяет нам извлекать данные из страниц и групп Facebook. Он не только предназначен для этой цели, но также имеет функции входа, статистики пользователей и многие другие. Однако наша цель - только извлечение данных из страниц и групп. Из-за некоторых причин безопасности Graph API не позволяет нам получать доступ к данным даже в открытых страницах или группах.
Например:
Мне понадобилось извлечь данные из группы Facebook. Сначала я сделал это из своей собственной группы и узнал, как это работает. Затем я перешел к группе, из которой мне нужны данные, но API не дал мне это сделать. Когда я прочитал форумы, я узнал, что раньше это было разрешено, но из-за причин безопасности теперь это невозможно.
Теперь давайте изучим нашу библиотеку;
Сначала установим нашу библиотеку Python.
pip install facebook-scraper
Добавим нашу библиотеку в любой открытый файл .py.
from facebook_scraper import get_posts
Теперь, когда мы добавили нашу библиотеку, мы можем начать извлекать данные.
for post in get_posts('название-страницы', pages=1):
print(post['text'])
Вместо 'название-страницы' вставляем идентификатор после 'facebook.com/'.
Например, ссылка на страницу Turkish Airlines на Facebook выглядит так:
https://www.facebook.com/TurkishAirlinesTR
Мы берем часть после '/', и добавляем ее. Теперь давайте получим текст сообщений, которые он отправил. Код будет выглядеть следующим образом:
from facebook_scraper import get_posts
for post in get_posts('TurkishAirlinesTR', pages=1):
print(post['text'])
Этот фрагмент кода предоставит нам все данные на первой странице.
Если вы хотите получить другие страницы, вы можете изменить 'pages=1' на желаемое количество страниц.
facebook-scraper предоставляет нам данные в формате 'ключ=значение'.
Этот пример был о том, как извлечь данные из страницы. Если вы хотите извлечь данные из группы, просто замените 'get_posts(group='название-группы', pages=1)'.
Чтобы получить больше помощи, вы можете написать в командной строке:
$ facebook-scraper --help
Или вы можете прочитать документацию ниже.
kevinzg/facebook-scraper
Парсинг публичных страниц Facebook без использования ключа API. Внесите свой вклад в развитие kevinzg/facebook-scraper, создав...
github.com
Faydalı olması dileğiyle...
Github аккаунт:
kemaleb - Обзор
Отклонить Регистрация на собственный профиль на GitHub, лучшем месте для размещения кода, управления проектами и создания программного...
github.com