加载中

Linkis - 计算中间件

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspar...

收藏 449
更新于 2022/06/23
Linkis

Apache IoTDB - 时序数据管理引擎

IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点,完美对接Hadoop与Spark生态,适用于工业物联网应用中海量时间序列数据高速写入和复杂分...

收藏 417
更新于 2022/04/04
Apache IoTDB

Apache Geode - 数据管理平台

概览 Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用. Geode 池化了服务器上的内存, CPU, 网络资源, 和本地磁盘,跨多个进程来管...

收藏 341
更新于 2021/09/04
Apache Geode

DataX Web - 分布式数据同步工具

DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据...

收藏 223
更新于 2020/07/01

PiFlow - 大数据流水线系统

PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特...

收藏 199
更新于 2022/03/11
PiFlow

Apache HAWQ - 大规模并行 SQL 分析处理引擎

HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。 Apache HAWQ 具有大规模并行处理很多传统数据库以及其他数...

收藏 196
更新于 2021/08/25
Apache HAWQ

elasticsearch-datatran - Elasticsearch 高效数据同步工具

Elasticsearch-datatran 由 bboss 开源的数据同步迁移工具,支持在Elasticsearch、关系数据库(mysql,oracle,db2,sqlserver、达梦等)...

收藏 164
更新于 2022/05/05

openLooKeng - 高性能数据虚拟化引擎

openLooKeng 是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源/数据中心分析能力以及面向交互式、批、流等融合查询场景。同时增强了前置调度、跨源索引、动态过滤、跨源协同、...

收藏 127
更新于 2022/01/29
openLooKeng

Blink - 阿里数据处理平台

Blink 最初是阿里巴巴内部的 Apache Flink 版本代号,基于阿里的场景做了大量的优化和稳定性改造工作。在经过一些讨论之后,我们决定将Blink的所有代码捐赠给Flink社区,并将其...

收藏 66
更新于 2019/01/28

Brooklin - 近实时大规模数据流式传输

Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息。 为什么要开发 Brooklin? ...

收藏 54

Rope - 轻量级 ETL 工具

Rope 是一款轻量级别的 ETL (Extract-Transform-Load) 工具。主要用于从不同源获取/接受数据,然后统一处理数据后,写入到各种目标源;系统采用多级缓冲和数据缓存,每秒...

收藏 55
更新于 2020/03/16

Hazelcast Jet - 基于 Hazelcast 的分布式数据处理引擎

Hazelcast Jet 是一个分布式计算平台,专为高性能流处理和快速批处理而构建。它在内存数据网格(IMDG)中嵌入Hazelcast,以提供轻量级的处理器包和可扩展的内存存储。 特性: 低...

收藏 49
更新于 2017/11/22
Hazelcast Jet

MR4C - C++ 的 MapReduce​ 框架

MR4C 是 Google 开发的 C++ 的 MapReduce 框架,你可以在 Hadoop 架构中执行本地代码。 依赖: tested with Ubuntu 12.04 and Cent...

收藏 46
更新于 2015/02/24

Apache SeaTunnel - 高性能分布式数据集成平台

seatunnel 是一个非常易用的支持海量数据实时同步的超高性能分布式数据集成平台,每天可以稳定高效同步数百亿数据,已在近百家公司生产上使用。 为什么我们需要 seatunnel seatun...

收藏 39
更新于 2022/01/24
Apache SeaTunnel

Dlink - 交互式的 FlinkSQL Studio

实时即未来,Dlink 为 Apache Flink 而生,让 Flink SQL 纵享丝滑,并致力于实时计算平台建设。 Dinky 基于 Apache Flink 实现 Dlink ,增强 F...

收藏 33
更新于 2022/04/07
开源软件作者
comNG 作者
qdbp-jdbc 作者
Ruoyi-Plus 作者

Qualitis - 数据质量管理平台

Qualitis 是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。 Qualitis 基于 Sprin...

收藏 30
更新于 2022/03/10

Cascading - Hadoop集群数据处理API

Cascading是一个新式的针对Hadoop clusters的数据处理API,它使用富于表现力的API来构建复杂的处理工作流,而不是直接实现Hadoop MapReduce的算法。

收藏 23

UMAD-SZU - 大数据管理分析系统

UMAD (Universal Management and Analysis of Data) 是致力于实现通用的大数据管理分析系统的项目。该项目利用度量空间的高度抽象性的特点,将各种各样的数...

收藏 20

MacroBase - 数据分析工具

MacroBase 是一个数据分析工具,利用机器学习优先处理大型数据集。 具体来说,MacroBase 是一个新的分析监督引擎,旨在进行大型数据集和数据流优先处理。与传统的分析引擎不同,Macr...

收藏 16
MacroBase

Wormhole-SPAAS - 流式处理平台

Wormhole 是一个 SPAAS(Stream Processing as a Service)平台解决方案。Wormhole 面向大数据项目的开发,运维以及管理人员,致力于简化和统一开发管...

收藏 15

没有更多内容

加载失败,请刷新页面

返回顶部
顶部
返回顶部
顶部