想问下你的电影网站是如何抓取以及是抓取哪里的资源

loda0128 发布于 2014/10/29 18:24
阅读 406
收藏 0

@北京-卫斯理 你好,想跟你请教个问题:我想 问下你开发v8电影网是从哪些网站抓爬的资源,我看了一些大的电影下载网站,里面排版乱的吓人,全是<br>换行标签这种。我看你的网站里面排版信息很清晰。

加载中
0
JFinal
JFinal
@mjaow 你也想整一个?
loda0128
loda0128
对啊,我想锻炼一下自己的能力,就先做一个这样的网站,目前抓了电影天堂的资源,里面电影页面的排版稀烂成渣了,没办法抓取单个属性。但我需要能抓取单个属性,拿到哪些数据以后可以再不同程度的扩展。顺便一提,我目前用的就是jfinal。嘻嘻!
0
本人纯属虚构
本人纯属虚构
用jsoup 或者 httpclient之类的解析网页 写一个针对你需要抓取网页的格式的处理类
0
北京-卫斯理
北京-卫斯理

引用来自“本人纯属虚构”的评论

用jsoup 或者 httpclient之类的解析网页 写一个针对你需要抓取网页的格式的处理类
正解,我就是用的 httpclient,解析的
loda0128
loda0128
3q
返回顶部
顶部