jsoup

软件主页
关注
本站使用 jsoup 来解析 HTML。 jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的...
加载中
12
回答
请教:Jsoup抓取页面(不知何原因被阻止)
Andre.Z 的回答 2011/06/28 10:36
最佳答案
你抓取得太狠了吧,速度快的话,对方网站服务器会不定时有一会无响应,处理如下: 1.对方网站有多个IP的时候,自己写个分发类,轮流去每个ip取。 2.对于1个IP的时候,遇到这种情况,当前线程就自动暂停几秒钟,然后再重试,自动马上重试的话,也有问题。 建议jsoup和httpclient一起用,...
5
回答
jsoup抓取的不是最终的显示页面?

jsoup读取的结果如下: <div class="star sa5"></div> 而我在FireFox浏览器中看到的结果却是这样的 <div clas...

2012/07/18 10:08
3
回答
如何使用jsoup清理html的同时保留css
无聊的人们啊 的回答 2012/08/22 10:34
最佳答案
自问自答一下吧,刚研究了一下jsoup的API,Whitelist的addAttributes能解决问题,继续研究了...
36
回答
OSChina 已使用 jsoup 来对帖子内容进行过滤

OSChina 今天早上刚刚对代码进行了改造,使用 jsoup 替换原有的 Htmlparser 来对包括发帖、回帖和评论等内容进行安全过滤。 过滤的条件...

2010/08/05 09:58
2
回答
Jsoup怎么解析页面中的示例代码

Jsoup怎么解析页面中的示例代码 比如页面中有一段示例代码显示为: <meta http-equiv="Content-Type" content="t...

2018/02/02 11:14
3
回答
jsoup post json

如何在jsoup.connect 中 提交一个json 参数呢

2015/09/03 20:27
3
回答
JSoup 直接抓取 URL 时对内容长度限制的解决办法

JSoup 不只是一个 HTML 的解析器,它自带的 HTTP 客户端包非常好用,而且很简单,至少比 HttpClient 要简单好多。 但是在使用过程中...

2017/11/24 20:11
5
回答
用JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容?

需求是这样的,做了一个新闻客户端,想用WEBVIEW显示新闻的内容,所以就涉及到HTML的解析,截取HTML里自己想要的内容,网上看了下 JSOUP 解析...

2012/04/20 11:24
8
回答
jsoup获取html页面乱码
francis-x 的回答 2013/10/29 15:55
最佳答案
我用的是正常的呀,你是用的Jsoup么?你给的代码应该是Java net API吧? public class Main { public static void main(String[] args) throws IOException { Document jsoup = Jsoup.c...
7
回答
求助,jsoup解析html时的乱码问题
小白小霸王 的回答 2012/07/26 03:25
最佳答案
开发环境问题,找找首选项能改成UTF-8的都改成UTF-8
6
回答
Jsoup 采集回来的信息出现乱码
NoahX 的回答 2012/11/20 23:25
最佳答案
一般出现这个情况是由于url指向的页面,实际编码与html中描述的编码不符导致。如:开发时用的GBK编码编写,但html中却写UTF-8。典型的就是在中文Windows下用记事本,写一个UTF-8的html就会出现这个问题。 你可以不用jsoup.connect,这个会从html描述中识别。 ...
18
回答
关于jsoup解析TXT中文乱码问题

我JSOUP代码: URL url_1 = new URL(filepath); Document text = Jsoup.parse(url_1,5*...

2011/01/14 10:51
2
回答
JSOUP class如何替换style?
淡定的米哥 的回答 2014/11/25 14:26
最佳答案
问题解决了怎么关闭呢?
1
回答
jsoup提取网页表格

java编程,利用jsoup提取网页表格,判断表格是否是规则的几行几列,连接数据库建立相应的表格。希望大神能够帮忙解决。 以下是我写的一点代码,能在原基础...

2017/03/30 17:09
2
回答
jsoup解析html 在正则报的错,不知道什么错

我的正则是这个 String Regular = "<tr height=\"25\">([^>]*>){3}(?<StockCode>[^<]*)([^...

2017/03/13 11:26
4
回答
jsoup.connect和jsoup.parse都失败了?菜鸟发问,求助!
红薯 的回答 2013/06/20 22:39
最佳答案
jsoup 是一个 HTML 解析器,尽管它也可以帮你抓网页,但不适合。 抓网页可以考虑用 httpclient 包
7
回答
网络爬虫,java语言写的,爬不到正确的网页源码,百思不得其解,不知问题症结在哪里?求助爬虫前辈们
aabbccli 的回答 2017/01/08 13:25
最佳答案
应该是页面需要JS渲染才能正常获取,可以用SELENIUM + PHANTOMJS来获取试试,最好贴出你要爬的网址,让同学们帮你瞅瞅
3
回答
对爬虫爬取到的数据管理
阿莫斯 的回答 2016/12/27 18:03
最佳答案
感觉你可以建立一个数据校验模块,在抓取完这些数据后通过数据校验模块 检查 数据的变动值,如果超过你设定的阈值 ,那么可以认为刚爬取的数据是异常的,则不更新原有数据
3
回答
为什么可以传json还要使用soap?

webservice之间传递json很方便,为什么要使用笨重的soap?

2016/11/17 14:42

没有更多内容

加载失败,请刷新页面

返回顶部
顶部