百度开源 OLAP 引擎 Palo,高可用的 MPP 数据仓库

王练
 王练
发布于 2017年08月12日
收藏 48

百度昨日正式开源 Palo ,这是一个百度自研的基于 MPP 的交互式 SQL 数据仓库,主要用于解决报表和多维分析。

Palo 主要集成了 Google Mesa 和 Cloudera Impala 技术。和其他流行的 SQL-on-Hadoop 系统不同的是,Palo 设计为单一紧密耦合系统,不依赖其他系统。

Palo 不仅提供高并发低延迟的查询性能,而且提供了高吞吐量的 ad-hoc 分析查询。它还提供批量数据加载,以及近乎实时的小批量数据加载。

Palo 具有高可用性、可靠性、容错性和可扩展性,其主要特点是简单(开发、部署和使用)和满足单一系统中的许多数据服务需求。

Palo 的实现包括两个守护进程:前端(FE)和后端(BE)。下图给出了架构和用法的概述:

Palo 的名字正好是OLAP倒过来写,意思是“玩转 OLAP ”,目前在百度内部有着广泛应用,如百度凤巢、百度统计、百度糯米等。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:百度开源 OLAP 引擎 Palo,高可用的 MPP 数据仓库
加载中

精彩评论

Seifon
Seifon
MPP 差点看成 卖屁屁

最新评论(5

Chet_W
Chet_W
第一次听到palo是两年前,还要用户自己上传到数据到百度,这么危险没保障的事,哪个企业会做呢?
Seifon
Seifon
MPP 差点看成 卖屁屁
开源中国首席罗纳尔多
开源中国首席罗纳尔多
请问什么是数据仓库?
吐槽的达达仔
吐槽的达达仔
CPP不好改源码。。
梦朝思夕
梦朝思夕
这个经常使用做报表
返回顶部
顶部