jsoup 1.2.2 发布,HTML解析类库

红薯
 红薯
发布于 2010年07月11日
收藏 3

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。

示例代码:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

该版本在解析性能上比以前提升了 3.5 倍,而HTML输出性能上提升了 2.5 倍,更低的内存占用率,增加对正则文本和属性选择器的支持。

下载 jsoup

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:jsoup 1.2.2 发布,HTML解析类库
加载中
返回顶部
顶部