Apache Parquet MR 1.8.0 发布了,该版本主要是修复两个 Bug:
* PARQUET-251: Fixed min/max in binary column stats corruption
* PARQUET-246: Fixed delta byte array data (2.0 encoding) corruption
Parquet是一种面向列存存储的文件格式,Cloudera的大数据在线分析(OLAP)项目Impala中使用该格式作为列存储。
Apache Parquet 是一个列存储格式,主要用于 Hadoop 生态系统。对数据处理框架、数据模型和编程语言无关。
暂无更多评论