Извлечение данных с любого веб-сайта в четыре простых шага с использованием Instant Data Scraper
Некоторое время назад я создал эту диаграмму, которая показывает, сколько зарабатывают африканские игроки в Английской премьер-лиге, используя данные с веб-сайта Capology, который предоставляет информацию о зарплатах футбольных игроков, контрактах и финансовых отчетах клубов топовых футбольных лиг мира.
Но получение конечного результата было небольшим вызовом, потому что обычный метод "копировать и вставить", который обычно был достаточным при извлечении данных с веб-сайтов, не работал на этом конкретном веб-сайте. Затем я нашел Instant Data Scraper, автоматизированный инструмент для извлечения данных.
Я много работаю с данными о спорте, в основном найденными на веб-сайтах, и этот инструмент работает намного лучше и экономит много времени. Вот как вы можете использовать его в четыре простых шага.
Шаг 1: Установка
Установите Instant Data Scraper в качестве расширения для Chrome, нажав на кнопку "Добавить в Chrome" и затем на кнопку "Добавить расширение", которая появится сразу после этого.
Теперь давайте начнем извлекать данные...
Шаг 2: Извлечение данных
Мы будем использовать данные о зарплатах команд Серии А на сезон 2022/23 года с сайта Capology для этого упражнения. На сайте они представлены следующим образом:
Целью сейчас является извлечение данных с веб-сайта и преобразование их в электронную таблицу, чтобы они были в удобном формате, который можно было бы обрабатывать.
После открытия страницы используйте расширение Chrome, которое вы найдете, нажав на значок пазла в правом верхнем углу вашего браузера.
После нажатия на расширение оно представит данные в следующем формате, и вы сможете сделать с ними несколько вещей перед загрузкой.
Используйте крестик в правом верхнем углу каждого столбца, чтобы удалить любой столбец, который вам не нужен. Если вы случайно удалили столбец, который вам нужен, вы можете нажать "Сбросить все", чтобы восстановить все столбцы в исходном формате.
Шаг 3: Получение данных
Когда вы удовлетворены своими данными, скопируйте их в свою таблицу, нажав на "Копировать все", а затем вставьте их. Или загрузите их в формате CSV или XLSX.
Шаг 4: Использование данных
После того, как у вас есть данные в таблице, вы можете использовать наши формулы таблицы или функции таблицы для манипулирования данными. Ознакомьтесь с нашим руководством по Flourish и Figma, чтобы создать пользовательские диаграммы с использованием только что извлеченных и обработанных данных.
Media Hack Collective предлагает обучение журналистов по работе с данными_ на всем континенте Африки и публикует данные журналистику на_ The Outlier, которая включает в себя растущую коллекцию диаграмм_ и_ информационные бюллетени на основе данных.