lucene的一种新的应用思路(海狗百亿数据的分析)

开心延年 发布于 2013/05/03 10:38
阅读 3K+
收藏 12
如何仅用10台左右的机器,在几秒到几十秒的时间内,分析百亿级别的数据?
  海狗(Higo)是一个分布式的在线分析查询系统,基于hadoop,lucene,solr,蓝鲸等开源系统作为实现,类SQL的查询语法。 海狗是一个能够对大量数据进行分布式处理的软件框架。海狗是快速的高性能的,他的底层使用了索引技术,数据扫描的速度大为增加。Higo是分布式的,它以并行的方式工作,通过并行处理加快处理速度。

ppt1 https://github.com/muyannian/higo/blob/master/doc/higo.pptx?raw=true
ppt2 https://github.com/muyannian/higo/blob/master/doc/higo_forcoder.pptx?raw=true
wiki https://github.com/muyannian/higo/wiki
开发日志 https://github.com/muyannian/higo/issues?direction=desc&sort=updated&state=open
加载中
0
thor.lee
thor.lee
很有意思
0
小白小霸王
小白小霸王
怎么还没被osc收录,,,
0
高新企业联盟
Higo是分布式http://www.chtip.org
0
tpopen
tpopen

引用来自“光头程序员”的答案

怎么还没被osc收录,,,
应该不是开源的产品,所以不会被收录。
0
小白小霸王
小白小霸王

引用来自“tpopen”的答案

引用来自“光头程序员”的答案

怎么还没被osc收录,,,
应该不是开源的产品,所以不会被收录。
   osc收录不是仅收录开源软件吧?商业的都收录,像MyEclipse    @红薯
0
狂奔的米粒
狂奔的米粒
海狗跟hive是什么关系?请教
0
平安北京
牛X的公司可以自己实现,不牛X的用这也没用,从哪里弄这么多可分析的数据啊
0
开心延年
开心延年

引用来自“狂奔的米粒”的答案

海狗跟hive是什么关系?请教
准确的说没关系,不过我的真实项目的元数据都是放到hive里的,只不过海狗从hive的存储路径中将数据读过来,创建索引而已
返回顶部
顶部