CoderCastrov logo
CoderCastrov
API

Когда использовать парсинг данных в вашей программе или проекте?

Когда использовать парсинг данных в вашей программе или проекте?
просмотров
2 мин чтение
#API
Table Of Content

    Как и при получении данных из API или формата JSON для использования их в других приложениях или проектах, парсинг данных на Ruby или на других языках позволяет нам сделать то же самое, но немного по-другому.

    Каков самый ясный смысл парсинга данных? Это программный метод, который позволяет нам извлекать данные, читаемые человеком, из выбранного исходного веб-сайта или приложения для использования в другой программе или приложении. Часто мы используем парсинг данных, когда API не может быть использован. Другими словами, не все программы, веб-сайты или приложения предоставляют API. Поэтому, чтобы получить, извлечь или экспортировать нужную информацию, мы используем парсинг данных.

    Чтобы использовать парсинг данных, необходимо знать CSS-селекторы. Мы должны знать точные CSS-селекторы, на которые мы хотим сосредоточиться на выбранном веб-сайте, чтобы извлечь точные данные или информацию для экспорта. Ruby предоставляет быстрый способ парсить данные с помощью гема под названием Nokogiri. Этот гем позволяет легко получать HTML-документы и достигать CSS-селекторов. Представьте, что вы имеете дело с веб-сайтом, содержащим огромное количество информации, которую вы никогда не понадобится или не будете использовать. Или, в конкретном случае, предположим, что вы создаете спортивное веб-приложение и замечаете, что этот журнал периодически предоставляет информацию о спорте, которую вы хотели бы использовать в своем проекте. В этом случае ваше внимание не сосредоточено на других разделах журнала или новостного сайта. Оно сосредоточено на разделе "спорт". Поэтому вам нужно знать, какой раздел спортивных новостей вам действительно нужен и сосредоточиться на этих CSS-селекторах, чтобы извлечь нужные данные или информацию.

    Одно из самых больших преимуществ использования парсинга данных заключается в том, что извлекаемая информация является динамической, то есть ваше приложение или программа будет отражать точно такую же информацию, которая существует на другом веб-сайте, с которого мы парсим данные. Информация в реальном времени. Например, если сегодня журнал отражает "Менеджер "Реал Мадрид": Зинедин Зидан", а на следующий день или в следующий час он может отражать "Менеджер "Реал Мадрид": Эден Азар". В вашей созданной программе или приложении будут отражены все изменения в реальном времени. Парсинг данных синхронизирует информацию в вашем приложении с информацией в разделе спорта журнала.

    Я создал проект CLI по парсингу данных и действительно считаю его отличным инструментом. Этот проект доступен на (https://github.com/SamuelC28/city_and_capital) и на YouTube (https://youtu.be/z5xHjsdqHw8). В этом проекте заполняется список некоторых стран с их городами, предоставленными веб-сайтом. Если или когда этот веб-сайт решит изменить свой список стран и городов, при запуске моего CLI-проекта все изменения будут отражены.