加载中

Apache Kylin - OLAP 分析引擎

Apache Kylin 是一个开源的分布式的 OLAP 分析引擎,来自 eBay 公司开发,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 级别的数据量。 Ap...

收藏 1195
更新于 2020/10/21
Apache Kylin

Hadoop - 分布式系统基础架构

Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(...

收藏 1006
更新于 2021/06/03
Hadoop

Apache HBase - 分布式数据库

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是G...

收藏 524
更新于 2021/10/27
Apache HBase

PrestoDB - 大数据查询引擎

Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。 PrestoDB 是 Facebook 推出...

收藏 450
更新于 2021/01/03
PrestoDB

Crate - 数据存储系统

Crate Data 是一个开源的大规模的可伸缩的数据存储系统,无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过 SQL 进行检索。易于安装和使...

收藏 363
更新于 2021/11/15
Crate

OpenSOC - 安全大数据分析框架

OpenSOC:安全大数据分析框架。OpenSOC已经加入Apache工程改名为Apache Metron。 思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关...

收藏 262
更新于 2014/12/20

Apache Beam - 大数据批处理和流处理标准

Apache Beam 是 Apache 软件基金会越来越多的数据流项目中最新增添的成员,是 Google 在2016年2月份贡献给 Apache 基金会的孵化项目。 这个项目的名称表明了设计:...

收藏 252
更新于 2021/11/23
Apache Beam

RedHadoop - 企业大数据平台

RedHadoop 是一个持续优化的企业级Hadoop基础软件平台,让Hadoop大数据更简单! RedHadoop大数据工场企业版是RedHadoop公司第一款产品,简称BWE(RedHado...

收藏 253
更新于 2013/10/21

HTools - Hadoop集群监控工具

HTools是一款专业的Hadoop管理工具,不管您是非专业IT人士,还是多年经验的技术人员,本工具都会为您提供优质的管理服务和轻松的操作过程, 释放无谓的工作压力,提高Hadoop的管理水平。...

收藏 235
更新于 2013/12/24

Apache Tajo - 分布式数据仓库系统

Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的 SQL 查询处理,基于存储雨 HDFS...

收藏 205
更新于 2016/05/20

MLF - 大数据机器学习框架(弥勒佛)

让天下没有难做的大数据模型! 功能 下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间 监督式学习:最大熵分类模型(max entropy classifier),决策树...

收藏 197
更新于 2016/05/03

Apache Eagle - Hadoop 数据安全方案

Apache Eagle 是 eBay 公司推出的分布式实时安全监控引方案,该项目已正式加入 Apache 成为孵化项目。Apache Eagle 提供一套高效分布式的流式策略引擎,具有高实时、...

收藏 177
更新于 2017/06/05
Apache Eagle

Suro - 数据管道服务

Netflix 开源了一个叫做Suro的工具,它能够在数据被发送到不同的数据平台(如Hadoop、Elasticsearch)之前,收集不同应用服务器上的事件数据,这项创新技术具备成为大数据主流...

收藏 158

Apache CarbonData - 华为大数据存储方案

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以...

收藏 146
更新于 2018/11/19
Apache CarbonData

WhereHows - 数据发现和管理工具

WhereHows 是 LinkedIn 公司一个用于大数据发现和管理的工具,集成了所有主要的数据处理系统,可以进行分类收集和元数据操作。方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各...

收藏 142
更新于 2016/03/10
开源软件作者
Pagination2 作者
ZNBase 作者
cy-
esionet-admin 作者

Apache Trafodion - 分布式SQL引擎

概览 Trafodion提供了一个基于Hadoop平台的交易型分布式SQL引擎。它是一个擅长处理交易型负载的Hadoop大数据解决方案。其主要特性包括: 完整的ANSI SQL 92/99语言支...

收藏 135
更新于 2021/05/16
Apache Trafodion

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 134
更新于 2018/12/14
Apache Griffin

Spring XD

Spring XD 是一个统一的,分布式,可扩展的系统用于数据摄取,实时分析,批量处理和数据导出。该项目的目标是简化大数据应用的开发。

收藏 124
更新于 2015/11/20

Apache Arrow - 内存数据交换格式

Apache Arrow是Apache基金会下一个全新的开源项目,同时也是顶级项目。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。 用户在应用大数据分析时除了将Hadoop等大...

收藏 109
更新于 2021/10/30
Apache Arrow

Apache Apex - 流和批处理引擎

Apache Apex 是一个企业级的统一流和批处理引擎。提供高度可伸缩、高性能、容错、有状态、安全和分布式的大数据处理,同时操作起来非常简单容易。

收藏 105
更新于 2017/11/21
Apache Apex

没有更多内容

加载失败,请刷新页面

返回顶部
顶部