加载中

Linkis - 计算中间件

Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/...

收藏 462
更新于 2024/01/05
Linkis

Apache IoTDB - 时序数据管理引擎

IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点,完美对接Hadoop与Spark生态,适用于工业物联网应用中海量时间序列数据高速写入和复杂分...

收藏 410
更新于 2023/06/25
Apache IoTDB

Apache Geode - 数据管理平台

概览 Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用. Geode 池化了服务器上的内存, CPU, 网络资源, 和本地磁盘,跨多个进程来管...

收藏 333
更新于 2021/09/04
Apache Geode

PiFlow - 大数据流水线系统

PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特...

收藏 201
更新于 2024/04/22
PiFlow

Apache HAWQ - 大规模并行 SQL 分析处理引擎

HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。 Apache HAWQ 具有大规模并行处理很多传统数据库以及其他数...

收藏 192
更新于 2021/08/25
Apache HAWQ

elasticsearch-datatran - Elasticsearch 高效数据同步工具

bboss-datatran --- 简化版Flink bboss-datatran由 bboss 开源的数据采集&流批一体化工具,提供数据采集、数据清洗转换处理和数据入库以及数据指标统计计算流...

收藏 184
更新于 2024/04/15

openLooKeng - 高性能数据虚拟化引擎

openLooKeng 是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源/数据中心分析能力以及面向交互式、批、流等融合查询场景。同时增强了前置调度、跨源索引、动态过滤、跨源协同、...

收藏 126
更新于 2022/01/29
openLooKeng

Apache SeaTunnel - 高性能分布式数据集成平台

SeaTunnel 是下一代超高性能的支持海量数据快速同步与集成的云原生数据集成工具,每天可以稳定高效同步万亿级数据,已在字节、B站、微博、腾讯云及印度电信等数百家公司生产上使用,目前也已经支持...

收藏 80
更新于 2024/03/04
Apache SeaTunnel

DataCap - 数据转换/集成/可视化

DataCap是数据转换、集成和可视化的集成软件。支持各种数据源,如MySQL,ClickHouse,PostgreSQL,Apache Druid等. 官网地址:https://datacap...

收藏 65
更新于 2024/04/22

Blink - 阿里数据处理平台

Blink 最初是阿里巴巴内部的 Apache Flink 版本代号,基于阿里的场景做了大量的优化和稳定性改造工作。在经过一些讨论之后,我们决定将Blink的所有代码捐赠给Flink社区,并将其...

收藏 63
更新于 2019/01/28

Rope - 轻量级 ETL 工具

Rope 是一款轻量级别的 ETL (Extract-Transform-Load) 工具。主要用于从不同源获取/接受数据,然后统一处理数据后,写入到各种目标源;系统采用多级缓冲和数据缓存,每秒...

收藏 62
更新于 2020/03/16

Brooklin - 近实时大规模数据流式传输

Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息。 为什么要开发 Brooklin? ...

收藏 55

Apache StreamPark - 流处理极速开发框架

StreamX 是一个 Apache Flink 极速开发框架。项目的初衷是 —— 让 Flink 开发更简单。 StreamX 定位是 Flink|Spark 开发脚手架 + 流批一体大数据平...

收藏 53
更新于 2024/02/06
Apache StreamPark

Hazelcast Jet - 基于 Hazelcast 的分布式数据处理引擎

Hazelcast Jet 是一个分布式计算平台,专为高性能流处理和快速批处理而构建。它在内存数据网格(IMDG)中嵌入Hazelcast,以提供轻量级的处理器包和可扩展的内存存储。 特性: 低...

收藏 48
更新于 2017/11/22
Hazelcast Jet

Dlink - 交互式的 FlinkSQL Studio

实时即未来,Dlink 为 Apache Flink 而生,让 Flink SQL 纵享丝滑,并致力于实时计算平台建设。 Dinky 基于 Apache Flink 实现 Dlink ,增强 F...

收藏 37
更新于 2024/03/02
开源软件作者
BeeAPM 作者
Apache Kvrocks 作者
spring-boot-assembly 作者

Qualitis - 数据质量管理平台

Qualitis 是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。 Qualitis 基于 Sprin...

收藏 35
更新于 2022/07/12

UMAD-SZU - 大数据管理分析系统

UMAD (Universal Management and Analysis of Data) 是致力于实现通用的大数据管理分析系统的项目。该项目利用度量空间的高度抽象性的特点,将各种各样的数...

收藏 21

Amoro​​​​​​​ - 流式湖仓服务

Amoro(原名 Arctic)是一个基于开放数据湖格式构建的 Lakehouse 管理系统。Amoro 与 Flink、Spark 和 Trino 等计算引擎合作,为 Lakehouse 带来...

收藏 20
更新于 2023/11/17
Amoro​​​​​​​

Cascading - Hadoop集群数据处理API

Cascading是一个新式的针对Hadoop clusters的数据处理API,它使用富于表现力的API来构建复杂的处理工作流,而不是直接实现Hadoop MapReduce的算法。

收藏 22

OpenMetadata - 元数据开放标准

OpenMetadata 是元数据的开放标准,发现、协作和正确获取数据的单一场所。 OpenMetadata 包括以下内容: 元数据模式- 定义元数据的核心抽象和词汇表,其中包含类型、实体、实体...

收藏 17
OpenMetadata

没有更多内容

加载失败,请刷新页面

返回顶部
顶部