Как создать парсер на Java?
Table Of Content
На прошлой неделе я закончил финальный проект в классе по Java.
Наш проект - это рекомендатель подарков, который рекомендует подарки с сайта на основе персональных данных.
Я сделал презентацию об этом и получил вопрос о парсере, который создается на Java.
Итак, я расскажу об этом здесь.
Я создал парсер, чтобы получить заголовки статей с Medium, вот так.
Он действительно простой.
Я использую Jsoup для создания парсера, это действительно хорошая библиотека с открытым исходным кодом.
Первая строка - я получаю весь HTML-документ из URL, конечно, его можно записать как директорию, например "search?q=Java".
Но использование метода data более понятно и гибко.
Вторая строка - получение элементов с именем класса "graf--title" для получения названия заголовка. Заголовок истории находится внутри тега div с классом "graf--title" в HTML.
Также можно использовать множество методов для получения элементов, например "getElemetsById" и "getElementsByAttribute" и другие, выбор метода зависит от цели.
С третьей по шестую строку - просто вывод каждого заголовка. Вот и все.
Summary
Переведи введенный markdown код с английского на русский. Сохрани оригинальную разметку markdown и изображения на своих местах. Вместо слов скрэпинг/скрапинг/скрапер/скрэпер используй парсинг/парсер/парсить. Возвращай только markdown код, без дополнительного текста