如何用java执行爬到网页中的js?

liangtee 发布于 2012/12/03 13:27
阅读 2K+
收藏 1

开源之夏第三届火热来袭,高校学生参与赢万元奖金!>>>

我用httpclient发送请求,然后想执行返回信息中的js,比如:

<a href="javascript:sAlert('diy00120468210')">这个点击如何执行?谢谢~

加载中
0
ALOSIN
ALOSIN
如果只是单纯的抓取网站数据(包括登录以后),似乎都不需要解析,执行js。如果是ajax直接加一段httpGet,httpPost的头new BasicHeader("X-Requested-With", "XMLHttpRequest"),如果 如你问题所示必须执行js,试试htmlunit,它是jsoup + httpclient以及带有js解析器的结合体,本来是web测试用的框架
1
martinyuan
martinyuan
用web自动化测试框架  selenium,是一个很好的选择
0
leo108
leo108
自己写一个JS解析引擎吧
liangtee
liangtee
那直接写个浏览器内核吧。。。
0
黄亿华
黄亿华
可以用Java自带的js引擎Rhino,不过你能不能抓到完整的依赖js是个大问题...
0
南湖船老大
南湖船老大
把JS 逻辑转成Java。看起来像是个Ajax请求,可以结合jsoup+HTTP 模拟实现,直接提交。
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部
返回顶部
顶部