开源中国社区
找到您想要的开源软件,分享和交流 Android客户端 iPhone客户端 开源软件 资讯
软件
当前位置: 开源软件 » 软件分类 » HTML解析器 » jsoup

HTML解析器 jsoup 191人收藏此软件, / 提醒设置

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。

jsoup的主要功能如下:

  1. 从一个URL,文件或字符串中解析HTML;
  2. 使用DOM或CSS选择器来查找、取出数据;
  3. 可操作HTML元素、属性、文本;

jsoup是基于MIT协议发布的,可放心使用于商业项目。

示例代码:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

 

jsoup最新更新资讯,共17条  (投递新闻查看所有»)
相关标签 Java(5) Android(3) HTML(3) KindEditor(2) Android SDK(2) HTMLParser(2) Cookie(2) OSCHINA(1) ListView(1) 敏感词(1) CSS4J(1) HtmlUnit(1) dom4j(1) HttpClient(1) jQuery(1) 精华(1) JSON Parser(1) 中文乱码(1) jQuery XML(1)
哈哈哈哈哈哈哈

获得不包含<a>标签的<div>标签的内容,语句该怎么打呢?

哈哈哈哈哈哈哈 发表于2天前 ,最后回答(2天前):勇者天空»

  • 1回答
  • 0投票
  • 54浏览
qqhegg

android Jsoup 实现部分HTML文件获取

qqhegg 发表于10天前 ,最后回答(7天前):qqhegg»

  • 2回答
  • 0投票
  • 80浏览
青春陪葬了无知的年华

搞过博客的来讨论 一下,一般的博客文章摘要怎么做比较好?

青春陪葬了无知的年华 发表于8天前 ,最后回答(8天前):红薯»

  • 2回答
  • 0投票
  • 45浏览
henku126henkulzh12

JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容?...

henku126henkulzh12 发表于1个月前 ,最后回答(1个月前):henku126henkulzh12»

  • 2回答
  • 0投票
  • 117浏览
红薯

OSChina原创:使用 jsoup 对 HTML 文档进行解析和操作...

红薯 发表于1年前 ,最后回答(1个月前):maxid»

  • 20回答
  • 0投票
  • 3580浏览
前路@……

JSOUP提取网页中的链接,如何遇到相对路径问么处理?

前路@…… 发表于1个月前 ,最后回答(1个月前):前路@……»

  • 7回答
  • 0投票
  • 188浏览
哈哈哈哈哈哈哈

关于解析多个html文件以及解析远程共享文件中的html

哈哈哈哈哈哈哈 发表于1个月前 ,最后回答(1个月前):红薯»

  • 1回答
  • 0投票
  • 45浏览
无为_YFH

jsoup 用在什么场所? 能做什么东西?

无为_YFH 发表于1个月前 ,最后回答(1个月前):李毅»

  • 5回答
  • 0投票
  • 241浏览
哈哈哈哈哈哈哈

实习生新人报道,关于jsoup方面能得到详细耐心的讲解

哈哈哈哈哈哈哈 发表于1个月前 ,最后回答(1个月前):像风一样自由_wei»

  • 3回答
  • 0投票
  • 146浏览
哈哈哈哈哈哈哈

怎样以最简洁的代码提取html的文字

哈哈哈哈哈哈哈 发表于1个月前 ,最后回答(1个月前):Andre.Z»

  • 1回答
  • 0投票
  • 157浏览
leo108

想知道OSC过滤用户输入的函数

leo108 发表于1个月前 ,最后回答(1个月前):红薯»

  • 1回答
  • 0投票
  • 96浏览
彭博

怎样用JAVA格式化一段换行混乱的代码字符串

彭博 发表于2个月前 ,最后回答(2个月前):曾杰»

  • 6回答
  • 0投票
  • 344浏览
罗晓波

jsoup可以访问js运行之后的html页面吗?

罗晓波 发表于3个月前 ,最后回答(2个月前):罗晓波»

  • 8回答
  • 0投票
  • 300浏览
罗晓波

jsoup,doc = conn.timeout(300000).get();没有反应,程序卡在...

罗晓波 发表于3个月前 ,最后回答(2个月前):罗晓波»

  • 4回答
  • 0投票
  • 92浏览
yayaya

android中用jsoup提取html表格的问题

yayaya 发表于9个月前 ,最后回答(2个月前):migoo»

  • 8回答
  • 0投票
  • 1094浏览
Tree

jsoup 貌似不支持xml的解析啊

Tree 发表于1年前 ,最后回答(3个月前):Tree»

  • 2回答
  • 0投票
  • 288浏览
hebeijpp

jsoup选择器遇到一有意思的情况,好像是一bug

hebeijpp 发表于3个月前 ,最后回答(3个月前):hebeijpp»

  • 3回答
  • 0投票
  • 136浏览
罗晓波

Jsoup解析HTML报500错误

罗晓波 发表于3个月前 ,最后回答(3个月前):hillshills»

  • 11回答
  • 0投票
  • 235浏览
hillshills

JSoup的正则表达式是什么引擎的?

hillshills 发表于3个月前 ,最后回答(3个月前):hillshills»

  • 3回答
  • 0投票
  • 156浏览
lrwin

刚发现jsoup的eq跟jquery的规则不一样,尽快支持索引吧...

lrwin 发表于4个月前 ,最后回答(4个月前):Andre.Z»

  • 1回答
  • 0投票
  • 111浏览
更多jsoup的问题 »

使用 jsoup 中的任何问题

我要提问/分享
已发布:)

显示所有 » 共有46个类似软件