Apache Drill 1.0 发布,大型数据集分析系统

oschina
 oschina
发布于 2015年05月20日
收藏 47

Apache Drill 1.0 发布,这是一个里程碑版本。此版本在 SQL-on-Hadoop上提升了安全性能,此外,它还解决了Hadoop上自助服务 SQL 查询的空缺,尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数据,和 Qlik 一起使用的话,能够让用户发现更多数据方面的商用价值。

Apache Drill 在基于 SQL 的数据分析和商业智能(BI)上引入了 JSON 文件模型,这使得用户能查询固定架构,演化架构,以及各种格式和数据存储中的模式无关(schema-free)数据。该体系架构中关系查询引擎和数据库的构建是有先决条件的,即假设所有数据都有一个简单的静态架构。

Apache Drill 的架构是独一无二的。它是唯一一个支持复杂和无模式数据的柱状执行引擎(columnar execution engine),也是唯一一个能在查询执行期间进行数据驱动查询(和重新编译,也称之为 schema discovery)的执行引擎(execution engine)。这些独一无二的性能使得 Apache Drill 在 JSON 文件模式下能实现记录断点性能(record-breaking performance)。

此版本现已提供下载:

直接下载文件:http://getdrill.org/drill/download/apache-drill-1.0.0.tar.gz
Find an Apache mirror

HTTP:http://mirror.nus.edu.sg/apache/drill/drill-1.0.0/apache-drill-1.0.0.tar.gz

Backup Sites:

更多信息请查看订阅邮件

为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel.

该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。

Day-zero analytics & rapid application development

数据结构:

   Purpose-built for semi-structured/nested data

兼容已有的 SQL 环境和 Apache Hive:

 Compatibility with existing SQL environments and Apache Hive deployments

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Apache Drill 1.0 发布,大型数据集分析系统
加载中

最新评论(5

nirvanalei
nirvanalei
留给drill的机会不多了,impala已接近完整,presto也已站稳,hawq又闹开源
heichong
heichong
正式版?
卖红薯
卖红薯
跟hive或者impala是什么关系?
_hadooper
_hadooper
好快的节奏,要更上
William威廉
William威廉
apache 精品
返回顶部
顶部