Парсер
Парсинг данных с помощью PHP
Table Of Content
Говоря о парсинге данных, мы обычно обращаемся к Python с его множеством фреймворков, которые поддерживают эту функцию. Давайте рассмотрим Scrapy со всей его популярностью.
Вот его основные характеристики:
Быстрый и мощный: напишите правила для извлечения данных и позвольте Scrapy сделать все остальное.
Легко расширяемый: расширяемый по своей природе, легко добавлять новые функции, не затрагивая ядро.
Переносимый, Python: написан на Python и работает на Linux, Windows, Mac и BSD.
Однако PHP также имеет инструменты или библиотеки, которые мы можем использовать для этой цели. В PHP вы можете выполнять парсинг с помощью некоторых из этих библиотек:
- Goutte
- Simple HTML DOM
- htmlSQL
- cURL
- Requests
- HTTPful
- Buzz
- Guzzle
Я расскажу о использовании указанных инструментов в следующей серии. Увидимся в следующей серии.