分布式数据仓库系统 Apache Tajo

Apache
Java
跨平台
Apache
2013-11-21
红薯

Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具

特点:

  • 可伸缩性和低延迟

    • 完全分布式的 SQL 查询处理,基于存储雨 HDFS 的大数据集

    • 超低响应时间(约100毫秒),在合理数据范围内的简单查询

  • 支持长时间运行的查询

    • 容错支持,避免某些任务失败后的查询重启

    • 动态调度,处理和异构集群节点故障

  • ETL

    • ETL 可实现不同数据格式之间的转换

    • 支持多种文件格式,如 CSV、RCFile 和 RowFile

  • 扩展性

    • 支持用户自定义函数

    • 提供自定义文件格式的 Scanner/Appender 接口

  • 兼容性

    • 遵循 ANSI/ISO SQL 标准,非标准方面遵循 PostgreSQL 规范

    • 支持 HiveQL 模式

    • 在 HCatalog 和 Hive MetaStore 实现表访问

    • 支持 JDBC 驱动

  • 简单

    • 提供交互式 Shell 来提交 SQL 查询到 Tajo 集群

    • 提供备份和恢复工具

    • 异步/同步 Java API 来提交 SQL 查询到 Tajo 集群

加载中

评论(0)

暂无评论

Apache Tajo 0.11.3 发布,分布式数据仓库

Apache Tajo 0.11.3 发布了,Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具。 一些提升: * Fix incorrect DateTime and remove hard...

2016/05/20 07:23

Apache Tajo 0.11.2 发布,分布式数据仓库

Apache Tajo 0.11.2 发布了,Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具。 以下是一些值得关注的内容: - Support for hadoop ker...

2016/04/09 07:58

Apache Tajo 0.10.1 发布,分布式数据仓库

Apache Tajo 0.10.1 发布,Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的 SQL 查询处理,基于...

2015/07/01 07:54

Apache Tajo v0.9 发布

Apache Tajo v0.9 发布,此版本目标是优化传统 SQL 性能,改进 Tajo leading-edge 原生 SQL 支持;提高查询速度。 Apache Tajo v0.9 改进如下:  - More comprehensive and powerfu...

2014/10/22 07:45

Apache Tajo™ 0.8.0 发布

Apache Tajo™ 0.8.0 发布,此版本的源代码和二进制包已经提供下载。这个第一个高级版本发布,在这个版本中,关闭了 363 个 issues ,包括 25 个新特性,81 个改进和 164 个 bug 修复。 值得...

2014/05/01 18:59

Apache Tajo 宣布成为基金会顶级项目

Apache 基金会宣布 Apache Tajo 项目成为基金会的顶级项目。 Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟...

2014/04/02 08:23

Apache Tajo 0.2.0 发布,分布式数据仓库

Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的 SQL 查询处理,基于存储雨 HDFS 的大数据集 超...

2013/11/21 16:26

没有更多内容

加载失败,请刷新页面

没有更多内容

暂无问答

apache顶级项目(九) - T~Z

apache顶级项目(九) - T~Z https://www.apache.org/ Tajo Apache Tajo是Apache Hadoop的强大的大数据关系和分布式数据仓库系统。Tajo专为存储在HDFS(Hadoop分布式文件系统)和其他数据源上...

11/27 14:04
6
0
Apache大数据子项目

Accumulo,HBase BigTable实现 Airavata 微服务框架 Ambari Hadoop集群管理监控工具。由Restful和WEB管理界面组成 Apex,Samza,Flink,Flume,Storm 流式框架 Helix 通用集群管理框架,可实现管理...

06/24 09:32
8
0
React中的模式对话框

来自David Gilbertson对React模式对话框的讲解

2017/08/09 15:28
98
0
一共81个,开源大数据处理工具汇总(上)

本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者:...

2015/11/16 16:34
298
0
开源大数据利器汇总

类别 名称 官网 备注 查询引擎 Phoenix http://phoenix.incubator.apache.org/ Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写 Stinger http://hortonworks.com/l...

2015/05/21 11:57
296
0
192本软件著作用词分析(二)

192本软件著作用词分析

2015/03/27 05:36
79
0
apache的大数据时代

世界各地无数的组织,他们使用的数据现在日益庞大而复杂,使用传统的数据处理程序已无法再进行优化分析及获得洞察。而这正是的新一代的大数据应用程序要解决的问题。近期Apache软件基金会(AS...

2016/10/14 12:54
35
0
类SQL处理

  Actian SQL for Hadoop:高性能交互式的SQL,可访问所有的Hadoop数据;   Apache Drill:由Dremel授意的交互式分析框架;   Apache HCatalog:Hadoop的表格和存储管理层;   Apache ...

2016/08/31 10:54
23
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部