FIFA 21 Индекс игрока (первый проект в области Data Science)
Table Of Content
Это пояснительная статья о моем первом проекте в качестве нового ученика в области Data Science.
Идея проекта заключалась в парсинге индекса игроков FIFA 21 с любого веб-сайта, который содержит необходимые данные и позволяет выполнить эту операцию, а затем сохранить эти данные в базе данных и построить модель множественной линейной регрессии для прогнозирования общей оценки игрока на основе его оценок навыков.
Я обнаружил, что fifplay.com имеет необходимую информацию, и смог спарсить данные с него.
Я использовал пакет beautiful soup для парсинга и смог получить всю информацию об игроках.
Затем я загрузил данные в фрейм данных, используя pandas, как показано ниже.
Парсинг всей информации об игроках занял время, поэтому я хотел сохранить данные в базе данных, чтобы не выполнять парсинг каждый раз, когда мне понадобятся данные.
Поэтому я сохранил данные в базе данных, используя SQlite3, чтобы иметь возможность манипулировать данными в любое время без необходимости выполнять парсинг каждый раз.
После этого я начал изучать данные.
Затем я хотел визуализировать частоту игроков по позиции с помощью seaborn.
Я также хотел проверить распределение данных в зависимости от общей оценки игрока по позиции игрока, поэтому я визуализировал это в виде "ящика с усами".
Затем я создал модель множественной линейной регрессии для прогнозирования общей оценки игрока на основе различных атрибутов игрока, таких как (PAC, Passing, Shooting и т. д.).
Затем я хотел развернуть свою модель на веб-сайте, поэтому я использовал Flask и развернул приложение на Heroku.
В конце концов, мне очень понравилось делать этот проект, хотя я все еще начинающий, но я готов идти до конца, чтобы стать экспертом в этой перспективной и удивительной области.