爬虫(java) 如何获取到 js执行后的完整页面?

Inszt 发布于 2016/06/22 16:32
阅读 3K+
收藏 0
http://www.haodf.com/doctor/DE4r0BCkuHzdeZILvCBx2XzuGO4ty.htm


这是一个JS生成的 页面,源码里看不到 简介 处的 东西,同时 后台 也没有相关的 异步请求的 api地址。

怎么搞呢?

用什么组件 可以 获取到 执行完的 页面完整源码?
加载中
0
Zemo
Zemo

http://www.oschina.net/p/webcollector?fromerr=ZpDomkW4


0
探索人生
探索人生
我也想知道,帮顶~
0
huan
huan
htmlunit
0
不日小鸡

楼上正解,不过htmlunit有些也不能解析出来

调用浏览器去访问,可以得到完整源码

不日小鸡
回复 @caosw : 你要用selenium当然是这个了,我说的是其他组件
c
caosw
driver.page_source获取?
我家有个艳
请问怎么调用浏览器获取?请指导一下,如果可以麻烦给个例子最好。lan_chao1991@163.com
0
WolfX
WolfX
这个有点难,需要整合一个HTML+JS的解析引擎= =
0
张亦俊
张亦俊

我都是直接调用外部的phantomjs的

返回顶部
顶部