MacroBase - 数据分析工具

MacroBase 是一个数据分析工具,利用机器学习优先处理大型数据集。 具体来说,MacroBase 是一个新的分析监督引擎,旨在进行大型数据集和数据流优先处理。与传统的分析引擎不同,Macr...

收藏 16
MacroBase

CloudCanalProcess - CloudCanal SDK 数据处理器

CloudCanal Data Process 是一款针对 CloudCanal SDK 的开源数据处理器,原生官方 SDK 只有一些说明文档。 本项目是由官方人员发起并与社区共同推进的自定义代...

收藏 16
更新于 2024/05/30

Wormhole-SPAAS - 流式处理平台

Wormhole 是一个 SPAAS(Stream Processing as a Service)平台解决方案。Wormhole 面向大数据项目的开发,运维以及管理人员,致力于简化和统一开发管...

收藏 15

AthenaX - 数据流分析平台

AthenaX 是 Uber 的内部流分析平台,旨在满足以下需求并为每一个人提供可访问的流分析能力: (1)轻松为各类用户提供导航服务,而无需对其技术背景提出任何要求 ; (2)以可扩展及高效方...

收藏 14

esProc SPL - 数据分析引擎

esProc SPL 是一款面向结构化和半结构化数据的计算和处理引擎,可以用做分析型数据库和数据计算中间件。 esProc SPL 具有精心设计的丰富库函数和强大的语法,可通过 JDBC 接口在...

收藏 14
更新于 2023/10/16
esProc SPL

Hadapt - 自适应分析平台

Hadapt 是个自适应分析平台,为 Apache Hadoop 开源项目带来了 SQL 实现。Hadoop 非常健壮,并且可伸缩。所以通过其合并了关联数据存储的混合存储层,Hadapt 允许进...

收藏 14

Apache DataSketches - 开源的高性能大数据流算法库

Apache DataSketches 是开源的高性能大数据流算法库,主要针对大规模计算环境。Apache DataSketches 的专用流算法库(也被称为 sketches)包含小型数据结构...

收藏 12
更新于 2021/02/05

Vespa - 开放大数据服务引擎

Vespa 是雅虎开源的针对大数据集的低延迟计算引擎。它存储和索引数据,以便在服务时间对数据进行查询、选择和处理。 Vespa 可实现: 使用类似 sql 的查询和非结构化搜索来选择内容 组织所...

收藏 9
Vespa

OSSEAN - 全球开源软件实时分析监测系统

OSSEAN是一个全球开源软件实时分析监测系统,通过对全球主流开源社区进行持续数据实时采集和跨社区深度关联分析,提供开源项目检索、评估和排行等服务。开发单位为国防科技大学。 特性 社区覆盖面广 ...

收藏 9
OSSEAN

HUAWEI Analytics Kit - 华为分析服务示例

这是华为分析服务(HUAWEI Analytics Kit)与app集成的示例代码,可实现对分析服务开放能力的API调用,其演示了如何通过收集预定义事件和自定义事件以提高用户参与度和用户偏好。 ...

收藏 11
更新于 2021/09/06

Debezium - 变更数据捕获平台

Debezium 是一个为捕获数据更改 (Change Data Capture, CDC) 提供低延迟的流式处理平台,利用 Kafka 和 Kafka Connect 实现了持久性、可靠性和容...

收藏 8
更新于 2024/01/14

Cascalog - Hadoop 的数据处理解决方案

Cascalog 是 Hadoop 上的数据处理解决方案,无需 hassle。 Cascalog 是 Clojure 或者 Java 的全功能数据处理和查询库。Cascalog 主要的作用是处理...

收藏 8

Men-COOPER - 构建软件开发者知识图谱

COOPER 平台通过分析软件开发者大数据对开发者进行全方位画像和协作关系分析,并构建软件开发者知识图谱,在此基础上提供开发者和开发资源的智能搜索与推荐服务。 平台详细描述: COOPER 平台...

收藏 8
Men-COOPER

OneTable - Lakehouse 表格式间全方位互操作

OneTable 是一种表格式的全方位转换器,可促进数据处理系统和查询引擎之间的互操作性。Apache Hudi、Delta Lake 和 Apache Iceberg 之间无缝互操作。 One...

收藏 6
更新于 2023/11/18
OneTable

Surus - 大数据分析集合

Surus 是 Pig 和 Hive 的分析集合,包括以下功能: ScorePMML - 云评测模型工具 Robust Anomaly Detection (RAD) - 健壮的 PCA 实现

收藏 5
开源软件作者
layui-regionCheckBox 作者
fooking 作者
Milvus 作者

Pulsar-Flink Connector - 允许 Flink 向 Pulsar 读写数据

Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体,采用计算与存储分离架构设计,支持多租户、持久化存储、多机房...

收藏 4
更新于 2020/12/29

Flink Remote Shuffle - Flink 任务间数据交换

Flink Remote Shuffle 是一种批场景下利用外部服务完成任务间数据交换的 Shuffle 实现,本文后续将详细介绍 Flink Remote Shuffle 研发的背景,以及 F...

收藏 4

Hadoop-PDL - 基于组合设计工具 PBD 的数据布局 PDL

该项目提出了一种有效的基于组合设计工具 PBD (Pairwise Block Design) 的数据布局 PDL,以加快混合 EC 分布式存储系统中单节点故障的数据修复。 由于减少了机架间的通...

收藏 3

DIDI-ALITA - 基于图层的数据分析工具

ALITA(A Layered Instrument To Analysis)是一个基于分层分析来展示数据的工具,通过大量的业务需求沉淀抽象概括了“点”、“线”、“面”三种数据模型,完美融合地图...

收藏 1

没有更多内容

加载失败,请刷新页面