我要把这个爬虫集成到自己项目,特意请教一下

fk__ 发布于 2013/09/09 22:17
阅读 490
收藏 0

@自风 你好,想跟你请教个问题:

我要把Spiderman 集成到自己的项目(没用maven ), 我从gitcafe 上把您的项目gitClone 下来了, 我要集成到自己的项目里面,数据库该怎么配置呢, 抓取的数据在哪里处理 进行写入我的数据库呢. 我现在这个项目的目前持久层用的是hibernate ,该怎么进行集成呢? 

加载中
0
自风
自风
1.最新项目代码在GIT@OSC上: http://git.oschina.net/l-weiwei/spiderman
2.若要使用EWeb4J来访问数据库,请找这个项目参考: https://github.com/laiweiwei/SolidBase
3.若使用Hibernate,则按照Hibernate的方式来做
4.所谓集成,只需在爬虫抓取回调接口里进行数据持久化就行了,请参考Sample的TestSpider,其实就是在SpiderListener.onParse方法取得数据然后随便你怎么入库了。
返回顶部
顶部