分布式数据库 Apache HBase 1.4.0 带来新功能和改进

来源: OSCHINA
编辑: 局长
2017-12-21

Apache HBase 1.4.0 已发布,该版本是 1.4 系列的首个维护版本,目标仍是为 Apache 大数据生态系统等周边带来稳定可靠的数据库。

作为次要版本,1.4.0 包含许多新功能和改进,但它们不会出现在旧代码的维护版本中,不过会确保与数据格式的完全兼容以及与旧版本客户端的互操作性。

此外,该版本还修复了大量的 bug,详情点此参阅

下载地址:https://www.apache.org/dyn/closer.lua/hbase/1.4.0

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

上图描述了Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。

此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。

展开阅读全文
19 收藏
分享
加载中
最新评论 (1)
期待 2.0 GA
2017-12-21 09:46
0
回复
举报
更多评论
1 评论
19 收藏
分享
返回顶部
顶部