Анализ настроений бюджета Индии 2019 года с использованием правил на основе nltk
Table Of Content
Это небольшая попытка провести анализ настроений последнего индийского бюджета, представленного министром финансов Нирмалой Ситараман 5 июля 2019 года.
Данные для анализа настроений были собраны (с использованием библиотеки "requests") из статьи Times of India (https://timesofindia.indiatimes.com/business/india-business/budget-2019-highlights-gst-rate-on-electric-vehicles-to-be-lowered-from-12-to-5/articleshow/70084365.cms). Количество комментариев, взятых из этой статьи, составляло 300.
Анализ настроений был выполнен с использованием правил на основе метода nltk's SentimentIntensityAnalyzer с использованием словаря vader_lexicon. Поскольку размеченные данные не были доступны, был выбран метод на основе правил вместо метода обучения для классификации настроений.
Облако слов для нейтральных комментариев
Облако слов для положительных комментариев
Облако слов для отрицательных комментариев
Из всех сегментов кажется, что одним из выделенных слов является "средний класс" или "заработная плата". Одной из причин может быть то, что аудитория этой статьи в основном состоит из этого класса и обсуждает в основном вопросы, связанные с налогом на доходы.
И "Моди" кажется самым выделенным словом в разделе положительных настроений.
Топ-места вовлечения
На основе доступных данных о местоположении вовлеченных пользователей на графике ниже показаны топ-8 местоположений/городов пользователей и настроения из этих городов.
Похоже, что Бангалор недоволен бюджетом, в то время как большинство других городов кажется довольными. Это может быть связано с тем, что в Бангалоре проживает большое количество лиц с высокими заработками.
Настроения к наиболее понравившимся или не понравившимся комментариям
Ниже приведен анализ топ-15 комментариев, которые были понравившимися/не понравившимися, и настроения по этим комментариям.
Настроения топ-15 понравившихся комментариев
Настроения топ-15 не понравившихся комментариев
Похоже, что топ-понравившиеся/не понравившиеся комментарии являются оба "отрицательными" комментариями о бюджете, однако большинство комментариев, которые не понравились, кажется относящимися к отрицательным комментариям, а не к положительным или нейтральным.