加载中

Blink - 阿里数据处理平台

Blink 最初是阿里巴巴内部的 Apache Flink 版本代号,基于阿里的场景做了大量的优化和稳定性改造工作。在经过一些讨论之后,我们决定将Blink的所有代码捐赠给Flink社区,并将其...

收藏 63
更新于 2019/01/28

Apache IoTDB - 时序数据管理引擎

IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点,完美对接Hadoop与Spark生态,适用于工业物联网应用中海量时间序列数据高速写入和复杂分...

收藏 411
更新于 2024/09/02
Apache IoTDB

Linkis - 计算中间件

Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/...

收藏 462
更新于 2024/01/05
Linkis

PiFlow - 大数据流水线系统

PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特...

收藏 201
更新于 2024/04/22
PiFlow

GoPlus - 数据科学语言

Go+ 是目前第一个顺应“三位一体”发展潮流的编程语言,同时兼顾工程、STEM 教育、数据科学三大领域: for engineering:致力于让工程师可以使用简洁、容易掌握的语言去工作,这在纷...

收藏 121
更新于 2022/08/04
GoPlus

SandDance - 数据可视化工具

SandDance 是微软研究院( Microsoft Research )微软车库( Microsoft Garage )推出的免费数据可视化应用。SandDance 是一款以 Web 为基础...

收藏 234
更新于 2019/10/12

Apache Geode - 数据管理平台

概览 Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用. Geode 池化了服务器上的内存, CPU, 网络资源, 和本地磁盘,跨多个进程来管...

收藏 333
更新于 2021/09/04
Apache Geode

TipDM - 数据库建模平台和挖掘工具

TipDM数据挖掘建模平台是基于Python引擎、用于数据挖掘建模的开源平台。平台提供数量丰富的数据分析与挖掘建模组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出、数据...

收藏 165

Apache HAWQ - 大规模并行 SQL 分析处理引擎

HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。 Apache HAWQ 具有大规模并行处理很多传统数据库以及其他数...

收藏 192
更新于 2021/08/25
Apache HAWQ

DataCap - 数据转换/集成/可视化

DataCap是数据转换、集成和可视化的集成软件。支持各种数据源,如MySQL,ClickHouse,PostgreSQL,Apache Druid等. 官网地址:https://datacap...

收藏 68
更新于 2024/12/03

Rope - 轻量级 ETL 工具

Rope 是一款轻量级别的 ETL (Extract-Transform-Load) 工具。主要用于从不同源获取/接受数据,然后统一处理数据后,写入到各种目标源;系统采用多级缓冲和数据缓存,每秒...

收藏 62
更新于 2020/03/16

elasticsearch-datatran - Elasticsearch 高效数据同步工具

bboss-datatran --- 简化版Flink,引入一个Maven坐标,极低成本搞定数据采集、数据分析处理、数据流批处理计算 bboss-datatran由 bboss 开源的数据采集&...

收藏 185
更新于 2024/11/28

HStreamDB - EMQ 流数据库

HStreamDB 是一款专为流式数据设计的, 针对大规模实时数据流的接入、存储、处理、分发等环节进行全生命周期管理的流数据库。 它使用标准 SQL (及其流式拓展)作为主要接口语言,以实时性作...

收藏 83
更新于 2023/03/07
HStreamDB

ZNBase - NewSQL 分布式数据库

ZNBase 是浪潮打造的一款分布式数据库产品,具备强一致、高可用分布式架构、分布式水平扩展、高性能、企业级安全等特性,自研的原生分布式存储引擎支持完整 ACID,支持 PostgreSQL 协...

收藏 51
更新于 2021/08/16
ZNBase

Vespa - 开放大数据服务引擎

Vespa 是雅虎开源的针对大数据集的低延迟计算引擎。它存储和索引数据,以便在服务时间对数据进行查询、选择和处理。 Vespa 可实现: 使用类似 sql 的查询和非结构化搜索来选择内容 组织所...

收藏 9
Vespa
开源软件作者
FileTools 作者
Gulp-art-include 作者
xr-engine 作者

Apache StreamPark - 流处理极速开发框架

StreamX 是一个 Apache Flink 极速开发框架。项目的初衷是 —— 让 Flink 开发更简单。 StreamX 定位是 Flink|Spark 开发脚手架 + 流批一体大数据平...

收藏 53
更新于 2024/10/21
Apache StreamPark

OpenCTI - 开放的网络威胁情报平台

OpenCTI 即 Open Cyber Threat Intelligence Platform,开放网络威胁情报平台。它的创建是为了构建、存储、组织和可视化有关网络威胁的技术和非技术信息。 ...

收藏 112
更新于 2021/05/04
OpenCTI

Apache SeaTunnel - 高性能分布式数据集成平台

SeaTunnel 是下一代超高性能的支持海量数据快速同步与集成的云原生数据集成工具,每天可以稳定高效同步万亿级数据,已在字节、B站、微博、腾讯云及印度电信等数百家公司生产上使用,目前也已经支持...

收藏 85
更新于 2024/10/15
Apache SeaTunnel

ROOT-framework - 欧洲核子研究中心-数据处理框架

ROOT 是一个模块化的科学软件工具包,它是一个数据处理框架,提供了大数据处理、统计分析、可视化和存储所需的所有功能,主要使用 C++ 编写而成,同时可集成 Python 和 R 等其它语言。 ...

收藏 105
更新于 2019/08/20

Annoy - 求近似最近邻的库

Annoy 是 Spotify 开源的高维空间求近似最近邻的库,在 Spotify 使用它进行音乐推荐。最邻近搜索(Nearest Neighbor Search, NNS)又称为“最近点搜索”...

收藏 13
Annoy

没有更多内容

加载失败,请刷新页面

返回顶部
顶部