加载中

Moonbox - 数据虚拟化即服务(DVtaaS)平台解决方案

Moonbox是一个DVtaaS(Data Virtualization as a Service)平台解决方案。 Moonbox基于数据虚拟化设计思想,致力于提供批量计算服务解决方案。Moon...

收藏 26
更新于 2019/04/26

Sylph - 一站式流计算平台

简介 Sylph 被定位为大数据生态中的一站式流计算平台,您可以使用它来开发、管理、监控、运维您的流计算. 什么没看懂? 没关系apache-hive您总听过吧?(如果依然不知道,那么您最先需要...

收藏 53
更新于 2019/04/26
Sylph

SpinalTap - 变更数据捕获服务​

SpinalTap —— 通用可靠的变更数据捕获(Change Data Capture: CDC)服务 SpinalTap 是一种可扩展、高性能、可靠、无损的变更数据捕获(CDC)服务,能够检...

收藏 32
更新于 2018/09/28

TonY - 构建在 Hadoop YARN 上的 TensorFlow 框架​​​​​​​

TensorFlow on YARN (TonY) 是一个构建在 Hadoop YARN 上的 TensorFlow 框架。 TonY 可以将单节点或分布式 TensorFlow 训练作为 Ha...

收藏 13
更新于 2021/08/27
TonY

Metacat - 元数据发现服务框架

Metacat 是一个联合的元数据 API 服务,可以访问 Hive、RDS、Teradata、Redshift、S3 和 Cassandra。 Metacat 为您提供您所拥有的数据信息,包括...

收藏 19

Apache Fluo - 大规模数据集增量处理系统

Apache Fluo 是 Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理所有的数据。与批...

收藏 40
更新于 2018/03/08
Apache Fluo

Laxcus - 大数据管理系统

Laxcus 是一个多集群多用户多任务通用数据管理系统,支持百万级计算机节点,提供 EB 级可计算数据的存储和计算能力,综合云管理、大数据、数据库、中间件、容器五个领域的技术和功能,集运行、开发...

收藏 68
更新于 2018/01/23

Apache Edgent - 面向物联网设备的运行时

Apache Edgent 是一种编程模型和具有微内核风格的运行时,可嵌入到网关和小型的物联网设备中。Apache Edgent 能用于对来自器材、车辆、系统、应用、设备和传感器(例如树莓派或智...

收藏 99
更新于 2018/01/05
Apache Edgent

KSQL - 用于 Apache Kafka 的流数据 SQL 引擎

KSQL 用于 Apache Kafka 的流数据 SQL 引擎 注意:项目还处于开发者预览版,请暂时勿用于生产集群中。 KSQL 是 Apache Kafka 的开源流 SQL 引擎。 它为 ...

收藏 95
更新于 2018/12/16
KSQL

RuisiBI-OLAP - 睿思 BI-OLAP 多维分析系统

睿思BI-OLAP系统支持对数据表的OLAP查询,无需编写任何的代码,用户只需要通过语义层的定义就可以轻松搭建自己的多维数据模型并进行数据多维查询及可视化。 产品优势 简单易用 :系统十分易用,...

收藏 54

tinympi4j - 微型 java 分布式离线计算框架

tinympi4j 是一款微型的 java 分布式离线计算框架, 实现原理如图: 特性 简单直观, 没有任何学习难度 slave支持多个任务并发/并行执行 使用HTTP协议通信 场景: 找素数/...

收藏 40

Apache Arrow - 内存数据交换格式

Apache Arrow是Apache基金会下一个全新的开源项目,同时也是顶级项目。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。 用户在应用大数据分析时除了将Hadoop等大...

收藏 109
更新于 2021/10/30
Apache Arrow

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 134
更新于 2018/12/14
Apache Griffin

Apache Beam - 大数据批处理和流处理标准

Apache Beam 是 Apache 软件基金会越来越多的数据流项目中最新增添的成员,是 Google 在2016年2月份贡献给 Apache 基金会的孵化项目。 这个项目的名称表明了设计:...

收藏 252
更新于 2021/11/23
Apache Beam

YourHDFS - 封装了 Hadoop Client 的 API

一个封装了Hadoop Client的简单、方便的API,已经在生产环境中经受日千万级别次IO操作的检验。 支持以下功能: 1)自定义HDFS目录前缀 2)支持时间目录格式 3)支持按文件固定大...

收藏 17
开源软件作者
sitesCMS 作者
Casdoor 作者
hanzi_to_pinyin 作者

Apache Trafodion - 分布式SQL引擎

概览 Trafodion提供了一个基于Hadoop平台的交易型分布式SQL引擎。它是一个擅长处理交易型负载的Hadoop大数据解决方案。其主要特性包括: 完整的ANSI SQL 92/99语言支...

收藏 135
更新于 2021/05/16
Apache Trafodion

Apache CarbonData - 华为大数据存储方案

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以...

收藏 146
更新于 2018/11/19
Apache CarbonData

WhereHows - 数据发现和管理工具

WhereHows 是 LinkedIn 公司一个用于大数据发现和管理的工具,集成了所有主要的数据处理系统,可以进行分类收集和元数据操作。方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各...

收藏 143
更新于 2016/03/10

Apache Apex - 流和批处理引擎

Apache Apex 是一个企业级的统一流和批处理引擎。提供高度可伸缩、高性能、容错、有状态、安全和分布式的大数据处理,同时操作起来非常简单容易。

收藏 105
更新于 2017/11/21
Apache Apex

BigCore - 大数据高并发开发框架

一套开源的服务器集群分布式大数据高并发的快速开发框架,使用mongodb内存数据库,二级缓存技术。 .net版下载 https://git.oschina.net/bigcore/bigcore...

收藏 34

没有更多内容

加载失败,请刷新页面

返回顶部
顶部