Articles of jsoup

Разбор веб-сайта с помощью Jsoup, который динамически загружается как пользовательские свитки

Я работаю над проектом, который отображает имена песен и ссылку на эту песню, анализируя веб-сайт с помощью Jsoup. Единственная проблема заключается в том, что я могу получить только первые 10 элементов, которые я хочу с этого веб-сайта, потому что при прокрутке вниз сайт генерирует больше элементов. Конкретный веб-сайт, который я пытаюсь проанализировать, – это музыкальный […]

Как найти элементы подстрокой идентификатора с использованием селектор-синтаксиса Jsoup?

Я использовал Jsoup для извлечения страницы из URL. Я могу извлечь ссылку на определенный идентификатор, используя следующую строку кода: Elements links = doc.select("a[href]#title0"); Как я могу найти элементы, если я знаю только часть своего идентификатора, например «title». Я знаю, что я мог бы найти все ссылки с href, а затем перебирать «ссылки» и проверять, содержит […]

Как преобразовать строку в UTF-8 в Android?

Я использую парсер HTML под названием Jsoup для загрузки и анализа HTML-файлов. Проблема в том, что веб-страница, которую я соскабливаю, кодируется в кодировке ISO-8859-1 то время как Android использует UTF-8 (?). Это приводит к тому, что некоторые символы отображаются как вопросительные знаки. Поэтому теперь я думаю, что я должен преобразовать строку в формат UTF-8. Теперь […]

Android – с помощью Jsoup с файлом html android_asset

Хорошо, я использовал Jsoup для разбора html с удаленных URL-адресов, используя: Jsoup.connect(url).timeout(20000).get(); Теперь я пытаюсь читать локальные html-файлы, которые я сохранил в папке с assets . Я много искал, но я не могу найти решение. На примере Jsoup – загрузите документ из файла , они скажут следующее: File input = new File("/tmp/input.html"); Document doc = […]

Анализ с ошибкой jsoup throws (NetworkOnMainThreadException)

Я загрузил ядро ​​jsoup library jsoup-1.7.1.jar и импортировал его в свой проект с помощью Project -> Properties-> Java Build Path -> Add external Jars, и я вложил файл библиотеки в свою папку libs. Однако, похоже, есть некоторые проблемы с импортом библиотеки Jsoup в мой проект. Когда я запускаю свое приложение, при запуске я получаю эту […]

Альтернатива метода Jsoup.parse ()

Я использую Jsoup.parse() для анализа этих данных . Все работает хорошо, но занимает много времени. Например, эти данные занимают 20 секунд. Для синтаксического анализа. Существуют ли другие решения для моих нужд? Код: rezult = Jsoup.parse(res.parse().outerHtml(), "UTF-8").text(); Где res это текст из ссылки . =========== ОБНОВЛЕНИЕ ============= Я Jsoup.parse() эту переменную от Jsoup.parse() и понял, что […]

Ошибка при выпуске APK с AsyncTask и Jsoup

Я получаю эту ошибку: 03-04 09:55:55.915: W/dalvikvm(20171): Exception Ljava/lang/NullPointerException; thrown while initializing La/a/b/k; 03-04 09:55:55.915: W/dalvikvm(20171): Exception Ljava/lang/ExceptionInInitializerError; thrown while initializing La/a/b/l; 03-04 09:55:55.925: W/dalvikvm(20171): threadid=13: thread exiting with uncaught exception (group=0x40ab3300) 03-04 09:55:55.945: E/AndroidRuntime(20171): FATAL EXCEPTION: AsyncTask #1 03-04 09:55:55.945: E/AndroidRuntime(20171): java.lang.RuntimeException: An error occured while executing doInBackground() 03-04 09:55:55.945: E/AndroidRuntime(20171): at android.os.AsyncTask$3.done(AsyncTask.java:299) 03-04 […]

Есть ли способ ускорить Jsoup.parse ()?

Я использую всю строковую версию Jsoup.parse (): parse(String html, String baseUri) Выпуск скорости подключения для сравнения производительности. На обычном недорогом Android-телефоне вызов Jsoup.parse() на html String не очень редкой длинной страницы Википедии (~ 600 КБ) занимает 9 секунд ! Мой клиент не согласен с этой задержкой, и я думаю о том, чтобы сбрасывать Jsoup на […]

Есть ли что-то быстрее, чем Jsoup для очистки HTML?

Поэтому я создаю приложение, которое отображает графический план с сайта, на который я перехожу, в более удобный интерфейс. На данный момент у него много проблем, но самый большой из них – это выбор изображений для их отображения. То, как я это делаю прямо сейчас, изображения отображаются в GridView размером 12, отражая количество изображений на каждой […]

Jsoup.connect () работает с Java, а не с Android

Я пробовал Jsoup.connect() указанный на веб-сайте Jsoup, и отлично работает на Java. По какой-то причине я не могу заставить его работать в проектах Android (Eclipse), хотя я разрешаю разрешение на доступ в Интернет в своем AndroidManifest . Библиотека Jsoup установлена ​​правильно, и я могу работать с Jsoup.parse() без каких-либо проблем. Вот несколько строк кода того, […]