TagSoup против Jsoup против HTML Parser против HotSax против

Обилие парсеров HTML на выбор (и придерживайтесь) – это умение:

http://java-source.net/open-source/html-parsers

Как выбрать тот, который наилучшим образом соответствует следующим требованиям:

  1. Зрелый (меньше ошибок, чем остальные)
  2. Живое и дыхательное (т.е. поддерживаемое)
  3. Быстрая и ресурсоэффективная (предназначена для работы на Android)

Основываясь на своем опыте, какой HTML-парсер вы бы порекомендовали (для удовлетворения вышеуказанных требований) и почему?

Ну, я нашел ответ, который дал @BalusC в другом потоке :

  1. Если вы просто хотите использовать инструмент на основе XML для его перемещения: JTidy .
  2. Если вам нравится модульный тест HTML: HtmlUnit
  3. Если вы хотите извлечь определенные данные из HTML: Jsoup

Спасибо @BalusC.

Intereting Posts
Как я могу открыть закрытый InputStream, когда мне нужно его использовать 2 раза Тема приложения Android – разница при использовании темы из файла стиля xml Попытка вызвать виртуальный метод «java.lang.String android.content.Context.getPackageName ()» в ссылке на нулевой объект Как вы можете отлаживать телефон, который у вас нет? Как узнать, действительно ли приложение Android действительно утечки памяти? Android EditText inputType для поля StreetNumber Производительность Choppy ProgressBar при использовании в ListView Воспроизведение фрагмента после того, как onNewIntent не работает В Android как отключить сокет? Как определить тип дополнительного в пакете, удерживаемом намерением? Как я могу выполнить запрос к базе данных SQLite с двумя условиями? CheckBox.setText не работает (Android) Как исправить: «HAX не работает, а эмулятор работает в режиме эмуляции» Ошибка создания буфера протокола с Android NDK Неявный Z-заказ для ViewPagers