+
 新版
2014-08-08 16:20
同时抓取 http https AJAX页面 以及 pdf ppt等 该怎么设置?
我在使用nutch-htmlunit时发现它不能抓取https协议以及pdf等格式的文件
2014-08-08 15:26

引用来自“java10001”的评论

这个好,不过htmlunit感觉对于ajax的解析还是存在一些问题,不稳定

引用来自“snail9527”的评论

相当不稳定,容易死掉,效率极低。
请问你是指htmlunit本身不稳定还是我提交这个插件运行不稳定?
2014-08-08 10:23
我喜欢jsoup可惜不能取ajax
2014-08-08 09:34

引用来自“紫电清霜”的评论

没有java
打紫电
回复 @
{{emojiItem.symbol}}
返回顶部
顶部