Parquet 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Parquet 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议: Apache
开发语言: Java C/C++ 查看源码 »
操作系统: Linux
开发厂商: Apache
收录时间: 2014-06-29
提 交 者: bear256

Parquet是一种面向列存存储的文件格式,Cloudera的大数据在线分析(OLAP)项目Impala中使用该格式作为列存储。

Apache Parquet 是一个列存储格式,主要用于 Hadoop 生态系统。对数据处理框架、数据模型和编程语言无关。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

Parquet 的相关博客

parquet

[这篇文章让我理解了原理](https://github.com/Parquet/parquet-mr/wiki/The-striping-and-assembly-algorithms-from-the-Dr...

Parquet

Google 对于传说中3秒查询 1 PB 数据的 Dremel,有一篇论文:Dremel: Interactive Analysis of Web-Scale Datasets http://r...

Parquet文件读写与合并小Parquet文件

一、简介 先来一张官网的图片,也许能够帮助我们更好理解Parquet的文件格式和内容。 parquet设计让它更好的压缩比例和更快的过...

parquet介绍

Apache Parquet是Hadoop生态系统中任何项目均可使用的列式存储格式,而与选择数据处理框架,数据模型或编程语言无关。 parque...

parquet文件

parquet文件格式分析

hive外表parquet文件

外表关联parquet文件 1. 为什么关联了一次数据文件就不能二次被使用; 2. 为什么删除了employee,select还是可以而且有数据,...

Parquet 的相关问答

还没有任何问答,马上提问

评论 (0)

加载中
更多评论
0 评论
17 收藏
分享
返回顶部
顶部