如何使用Jsoup对html以及xml进行清洗,求指点,谢谢!

Snys 发布于 2011/10/30 15:12
阅读 742
收藏 0
我想对任意网页文件html或xml文件采用Jsoup进行清洗,删除掉源文件中的注释、文本内容,只保留标签内容,试了好多方法了,都打不到目的,求哪位大神指点指点,小弟不胜感激,谢谢!
加载中
0
G.
G.
用正则应该也可以做到.

因为html的标签属性都在 <> 里面.
0
Snys
Snys
用正则表达式要匹配的东西太多了吧,我只需要标签以及标签名,属性都可以不要.
返回顶部
顶部