Apache Impala 3.1.0 发布,高性能的分布式 SQL 引擎

王练
 王练
发布于 2018年12月07日
收藏 11

Apache Impala 3.1.0 已发布,暂未发现更新内容的介绍,点此保持关注


下载地址:

Apache Impala 是一个高性能分布式 SQL 引擎,是用于处理存储在 Hadoop 集群中的大量数据的 MPP(大规模并行处理)SQL 查询引擎。用 C++ 和 Java 编写而成,与其他 Hadoop 的 SQL 引擎相比,它提供了高性能和低延迟。

Impala 通过使用标准组件(如 HDFS,HBase,Metastore,YARN 和 Sentry)将传统分析数据库的 SQL 支持和多用户性能与 Apache Hadoop 的可扩展性和灵活性相结合。

  • 使用 Impala,与其他 SQL 引擎(如 Hive)相比,用户可以使用 SQL 查询以更快的方式与 HDFS 或 HBase 进行通信。

  • Impala 可以读取 Hadoop 使用的几乎所有文件格式,如 Parquet,Avro,RCFile。

Impala 将相同的元数据,SQL 语法(Hive SQL),ODBC 驱动程序和用户界面(Hue Beeswax)用作 Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。

与 Apache Hive 不同,Impala 不基于 MapReduce 算法。 它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。

因此,它减少了使用 MapReduce 的延迟,这使得 Impala 比 Apache Hive 快。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Apache Impala 3.1.0 发布,高性能的分布式 SQL 引擎
加载中

最新评论(1

进击的代码
进击的代码
"它负责在同一台机器上运行的查询执行的所有方面" 咋读咋觉得别扭....这是机器翻译?
返回顶部
顶部