Apache CarbonData 1.5.0 发布,华为大数据存储方案

oschina
 oschina
发布于 2018年10月25日
收藏 15

CarbonData 1.5.0 发布了,该版本更贴近于统一分析。我们希望能够从更多的引擎/库中读取CarbonData文件,以支持各种用例。在这方面,我们增加了支持从C++库读取 CarbonData 文件的支持。此外,可以使用Java SDK、Spark 文件格式接口、Spark、Presto 等读取 CarbonData 文件。

此外 CarbonData 添加了多个优化以减少存储大小,以便可以利用较小的IO进行查询。对来自 CarbonData 的流支持进行了一些改进。

在该版本中,包含了超过 150 项 JIRA 的条目,包括新特性、改进和 bug 修复。详细的列表请看发行说明

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支持“交互式分析、详单查询、任意维度组合的过滤查询等”多种大数据应用场景,并通过丰富的索引技术、字典编码、列存等特性提升了IO扫描和计算性能,实现百亿数据级秒级响应,与大数据生态Apache Hadoop、Apache Spark等无缝集成。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Apache CarbonData 1.5.0 发布,华为大数据存储方案
加载中

精彩评论

W
WO不吹牛
华为现在在开源界很活跃啊,linux、apache都有新内容了

最新评论(1

W
WO不吹牛
华为现在在开源界很活跃啊,linux、apache都有新内容了
返回顶部
顶部