百度开源 OLAP 引擎 Palo,高可用的 MPP 数据仓库 - 开源中国社区
百度开源 OLAP 引擎 Palo,高可用的 MPP 数据仓库
王练 2017年08月12日

百度开源 OLAP 引擎 Palo,高可用的 MPP 数据仓库

王练 王练 发布于2017年08月12日 收藏 50

百度昨日正式开源 Palo ,这是一个百度自研的基于 MPP 的交互式 SQL 数据仓库,主要用于解决报表和多维分析。

Palo 主要集成了 Google Mesa 和 Cloudera Impala 技术。和其他流行的 SQL-on-Hadoop 系统不同的是,Palo 设计为单一紧密耦合系统,不依赖其他系统。

Palo 不仅提供高并发低延迟的查询性能,而且提供了高吞吐量的 ad-hoc 分析查询。它还提供批量数据加载,以及近乎实时的小批量数据加载。

Palo 具有高可用性、可靠性、容错性和可扩展性,其主要特点是简单(开发、部署和使用)和满足单一系统中的许多数据服务需求。

Palo 的实现包括两个守护进程:前端(FE)和后端(BE)。下图给出了架构和用法的概述:

Palo 的名字正好是OLAP倒过来写,意思是“玩转 OLAP ”,目前在百度内部有着广泛应用,如百度凤巢、百度统计、百度糯米等。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:百度开源 OLAP 引擎 Palo,高可用的 MPP 数据仓库
分享
评论(5)
精彩评论
2
MPP 差点看成 卖屁屁
最新评论
0
第一次听到palo是两年前,还要用户自己上传到数据到百度,这么危险没保障的事,哪个企业会做呢?
2
MPP 差点看成 卖屁屁
0
请问什么是数据仓库?
0
CPP不好改源码。。
0
这个经常使用做报表
顶部