jsoup抓取的不是最终的显示页面?

无涯2008 发布于 2012/07/18 10:08
阅读 1K+
收藏 0

jsoup读取的结果如下:

<div class="star sa5"></div>

而我在FireFox浏览器中看到的结果却是这样的

<div class="star sa4"></div>

这个怎么理解?

初步确定为是jsoup抓取的是js加载之前的页面

以下是问题补充:

@无涯2008:请问有什么解决的办法没有啊! 用Java直接读取的貌似也是js加载之前的数据。 这种情况下,如何读取加载之后的页面啊 另外,读取ajax模块的时候也会出问题只能抓取到"加载中...“并不能抓取到真正的数据! (2012/07/18 10:38)
加载中
0
SNY
SNY
你可以考虑模拟js执行,java有现成的工具包,但还是不能保证拿到最终的页面。比较好的方式还是放弃单纯用java来处理,你还不如写一个chrome的插件或者firefox的扩展把页面搞下来……你是要抓数据还是单纯的保存系列网页而已?
0
无涯2008
无涯2008
只要抓取数据
0
郭幻程
郭幻程

用虚拟浏览器抓,MozSwing,DJNativeSwing....LoboBrowser.....

Jsoup不解析js地。。

0
无聊看看网
无聊看看网

这个帖子上是可以的http://www.wityx.com/bbs/post/288_1_1.html

返回顶部
顶部