java如何接收服务器传递过来的dwr数据

shizongger 发布于 2016/08/10 09:49
阅读 331
收藏 0

【Gopher China万字分享】华为云的Go语言云原生实战经验!>>>

   是这样的,项目经理喊我完成一个任务,就是在内网深挖员工的各种信息,比如在内网写了多少技术文章,发表多少篇新闻稿之类的,这些数据都是去内网的OA爬,我所用的爬虫技术是jsoup,这技术与jquery的dom编程有些类似,可是要命的是,内网挖到很多东西,比如文章之类的,都不是html元素,换句话说,即使是用jsopu去挖掘内网网页,也不是直接得到一个dom文档,而是传递回来一个dwr的字符串,目前我的做法完全是用正则表达式来提取里面的内容。比如传递回来这哥们:

s4.deptName=null;s4.grade=0;s4.graderAdivise=null;s4.htmlPath="/bjrd/oasys/static/2016-07-20/259136.html";s4.id=259136;s4.issueId=249309;



当然,上面只是片段而已,传递过来的字符串多的吓人呢!我就是用正则来提取上面的s4.htmlPath的,后面跟的是一个静态的html地址,这样就提取到了html内容。不过我觉得这样做很麻烦!

加载中
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部