Articles of html parsing

Пример Android Parser для Android

Я искал много парсеров HTML для Android. Я попробовал много библиотек. Может кто-нибудь, пожалуйста, покажите мне пример, как это сделать. Я хочу извлечь содержимое каждого тега. Пожалуйста помоги. Я застрял в этом.

Отображать изображения на Android с помощью TextView и Html.ImageGetter асинхронно?

Я хочу установить TextView с помощью SpannableString который из приведенного ниже метода: Html.fromHtml(String source, Html.ImageGetter imageGetter, Html.TagHandler tagHandler) Но ImageGetter здесь должен переопределить метод ниже: public abstract Drawable getDrawable(String source) Поскольку мне нужно получить доступный из Интернета, я должен сделать это асинхронно, и, похоже, это не так. Как заставить его работать? Благодарю.

HTML-парсер для создания форматированных данных GTFS

Существует транзитное агентство, которое не предоставляет данные о графике транзита в формате GTFS. Я хотел бы сделать приложение для Android, которое может искать в нем, поэтому этот формат будет очень полезен. Данные о транзитных расписаниях имеют веб-сайт, но, похоже, сложно отделить полезные вещи. <td class="b stopPoint p0" background="nline.gif"><a href="line.cgi?id=1&dir=back&zero=15901&city=so&term=20141214"><img src="coming.gif" class="stopPoint" alt="A megállóhoz tartozó indulási […]

Как преобразовать строку в UTF-8 в Android?

Я использую парсер HTML под названием Jsoup для загрузки и анализа HTML-файлов. Проблема в том, что веб-страница, которую я соскабливаю, кодируется в кодировке ISO-8859-1 то время как Android использует UTF-8 (?). Это приводит к тому, что некоторые символы отображаются как вопросительные знаки. Поэтому теперь я думаю, что я должен преобразовать строку в формат UTF-8. Теперь […]

Изображения изображений на Android ImageGetter, перекрывающиеся

Я пытаюсь загрузить блок HTML в TextView, включая изображения, используя URLImageParser p = new URLImageParser(articleBody, this); Spanned htmlSpan = Html.fromHtml(parsedString, p, null); Например, parsedString – это HTML. Во всяком случае, он загружается, но изображения не имеют никакого пространства, созданного для них, чтобы сидеть, поэтому они в конечном итоге перекрывают текст над ними. Вот мой файл […]

Android HTML ImageGetter как AsyncTask

Хорошо, я теряю рассудок над этим. У меня есть метод в моей программе, который анализирует HTML. Я хочу включить встроенные изображения, и у меня создается впечатление, что использование Html.fromHtml (string, Html.ImageGetter, Html.TagHandler) позволит это произойти. Поскольку у Html.ImageGetter нет реализации, я должен написать ее. Однако, поскольку разбор URL-адресов в Drawables требует доступа к сети, я […]

TagSoup против Jsoup против HTML Parser против HotSax против

Обилие парсеров HTML на выбор (и придерживайтесь) – это умение: http://java-source.net/open-source/html-parsers Как выбрать тот, который наилучшим образом соответствует следующим требованиям: Зрелый (меньше ошибок, чем остальные) Живое и дыхательное (т.е. поддерживаемое) Быстрая и ресурсоэффективная (предназначена для работы на Android) Основываясь на своем опыте, какой HTML-парсер вы бы порекомендовали (для удовлетворения вышеуказанных требований) и почему?