Парсинг данных Twitter (корона)
Table Of Content
Период сбора данных: 15 апреля 2020 года (20:20 WIB). Данные о местоположении - по всему миру.
- Вот шаги, которые я выполнил для парсинга данных Twitter с использованием приложения Gephi с использованием слова "timebside":
-
Сначала зарегистрируйтесь в разработчике Twitter, чтобы получить API Twitter.
-
Откройте приложение Gephi, которое уже установлено на вашем ноутбуке / ПК.
-
Если у вас еще не установлен Twitter Streaming Importer, установите его, перейдя в меню (Нажмите "Инструменты" -> "Плагины" -> "Доступные плагины" -> найдите "Twitter Streaming Importer" и установите его).
-
Если у вас уже установлен Twitter Streaming Importer, нажмите "Credentials", чтобы ввести API Twitter.
-
В поле "Add" введите фразу или слово, которое вы хотите найти, затем нажмите "Add".
-
В поле № 3 (Выберите логику сети, которую нужно применить) выберите "User Network".
-
Затем нажмите "Connect", чтобы начать поиск.
- Чтобы просмотреть таблицу данных, которую мы получили, нажмите "Data Laboratory". Затем нажмите "Export Table", чтобы сохранить данные в формате CSV.
-
Если таблица уже сохранена, создайте отображение и анализируйте эту таблицу с помощью Google Colab.
-
Сначала подключитесь к учетной записи Google, чтобы файл .csv можно было запустить в этом Python.
- Введите ссылку на таблицу.csv
- Чтобы получить только подпись или текст в Twitter, вы можете ввести набор данных, который называется "Label", так как подпись или текст в Twitter находятся в столбце "Label".
- Затем удалите пунктуацию и ненужные символы.
- Если пунктуация удалена, покажите результат.
5 основных тем из результатов отображения:
- publicnews.com
- ptiofficial
- muhammadalidog8
- doudoudestropi1
- hz_press
Этот текст был создан для выполнения задания по середине семестра
Имя = M.Muhlis(1461700036)
Класс = Информационный поиск (R)
Университет 17 августа 1945 года в Сурабае