加载中

Sylph - 一站式流计算平台

简介 Sylph 被定位为大数据生态中的一站式流计算平台,您可以使用它来开发、管理、监控、运维您的流计算. 什么没看懂? 没关系apache-hive您总听过吧?(如果依然不知道,那么您最先需要...

收藏 29
更新于 2018/11/28
Sylph

Jupyter Notebook - Web 交互式计算笔记本平台

Jupyter Notebook 是一个基于 Web 的交互式计算笔记本环境。 Jupyter Notebook 允许用户创建和共享各种内容,包括实时代码、方程式、可视化和叙述文本的文档。它的用...

收藏 3
更新于 2018/10/11

SpinalTap - 变更数据捕获服务​

SpinalTap —— 通用可靠的变更数据捕获(Change Data Capture: CDC)服务 SpinalTap 是一种可扩展、高性能、可靠、无损的变更数据捕获(CDC)服务,能够检...

收藏 18
更新于 2018/09/28

TonY - 构建在 Hadoop YARN 上的 TensorFlow 框架​​​​​​​

TensorFlow on YARN (TonY) 是一个构建在 Hadoop YARN 上的 TensorFlow 框架。 TonY 可以将单节点或分布式 TensorFlow 训练作为 Ha...

收藏 5
更新于 2018/09/16

Rain - Rust 实现的分布式计算框架

Rain 是一个 Rust 实现的轻巧且强大的分布式计算框架,适用于处理大规模的基于任务的管道。 Rain 旨在降低分布式计算世界的入门门槛,目的是提供一个轻巧而强大的分布式框架,该框架具有直观...

收藏 41
更新于 2018/07/11
Rain

Metacat - 元数据发现服务框架

Metacat Metacat 是一个联合的元数据 API 服务,可以访问 Hive、RDS、Teradata、Redshift、S3 和 Cassandra。 Metacat 为您提供您所拥有...

收藏 2

finndycloud - 开源分布式云采集工具化引擎

发源地开源云采集引擎 发源地云采集引擎是由发源地研发团队开发的一套开源分布式云采集工具化引擎,致力于让用户快捷挖掘大数据矿山背后的价值! 发源地云采集引擎完全基于云端,集数据采集、清洗、去重、加...

收藏 12

Apache Fluo - 大规模数据集增量处理系统

Apache Fluo 是 Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理所有的数据。与批...

收藏 35
更新于 2018/03/08
Apache Fluo

Laxcus - 大数据管理系统

Laxcus 是一个多集群多用户多任务通用数据管理系统,支持百万级计算机节点,提供 EB 级可计算数据的存储和计算能力,综合云管理、大数据、数据库、中间件、容器五个领域的技术和功能,集运行、开发...

收藏 47
更新于 2018/01/23

Apache Edgent - 面向物联网设备的运行时

Apache Edgent 是一种编程模型和具有微内核风格的运行时,可嵌入到网关和小型的物联网设备中。Apache Edgent 能用于对来自器材、车辆、系统、应用、设备和传感器(例如树莓派或智...

收藏 84
更新于 2018/01/05
Apache Edgent

Weld-Project - 用于数据分析应用程序的高性能运行时

Weld 使用 Rust 语言编写,可以使用 LLVM 编译器框架,为整个数据分析工作流生成高效的并行运行的代码。CSAIL 曾开发出了几个将速度推向极限的大数据加速项目,比如 Milk 和 T...

收藏 2

MacroBase - 数据分析工具

MacroBase 是一个数据分析工具,利用机器学习优先处理大型数据集。 具体来说,MacroBase 是一个新的分析监督引擎,旨在进行大型数据集和数据流优先处理。与传统的分析引擎不同,Macr...

收藏 3
MacroBase

Hazelcast Jet - 基于 Hazelcast 的分布式数据处理引擎

Hazelcast Jet 是一个分布式计算平台,专为高性能流处理和快速批处理而构建。它在内存数据网格(IMDG)中嵌入Hazelcast,以提供轻量级的处理器包和可扩展的内存存储。 特性: 低...

收藏 45
更新于 2017/11/22
Hazelcast Jet

HPAT - 基于编译器的大数据框架

HPAT 是一个基于编译器的大数据框架,使用 Python 编写。 高性能分析工具包(HPAT)是一个基于编译器的框架,用于群集/云环境中的大数据分析和机器学习,既易于使用又非常快速;它比 Ap...

收藏 2

AthenaX - 数据流分析平台

AthenaX 是 Uber 的内部流分析平台,旨在满足以下需求并为每一个人提供可访问的流分析能力: (1)轻松为各类用户提供导航服务,而无需对其技术背景提出任何要求 ; (2)以可扩展及高效方...

收藏 8
开源软件作者
贤心
layer mobile 作者
朋也
朋也社区 作者
ccflow周朋
JFlow 作者

Vespa - 开放大数据服务引擎

Vespa 是雅虎开源的针对大数据集的低延迟计算引擎。它存储和索引数据,以便在服务时间对数据进行查询、选择和处理。 Vespa 可实现: 使用类似 sql 的查询和非结构化搜索来选择内容 组织所...

收藏 8
Vespa

Wormhole-SPAAS - 流式处理平台

Wormhole 是一个 SPAAS(Stream Processing as a Service)平台解决方案。Wormhole 面向大数据项目的开发,运维以及管理人员,致力于简化和统一开发管...

收藏 7

KSQL - 用于 Apache Kafka 的流数据 SQL 引擎

KSQL 用于 Apache Kafka 的流数据 SQL 引擎 注意:项目还处于开发者预览版,请暂时勿用于生产集群中。 KSQL 是 Apache Kafka 的开源流 SQL 引擎。 它为 ...

收藏 73
更新于 2017/08/30
KSQL

OpenFEA - 可视化大数据分析挖掘工具

一、简介 FEA是一站式大数据敏捷分析中间件,融合了内存计算、机器学习、交互分析、可视化分析等技术,涵盖数据收集、数据探索、构建模型、发布模型、可视化展示、分析门户等功能,无需复杂编程即可快速实...

收藏 205
更新于 2017/06/01

Pilosa - 开源的分布式位图索引

Pilosa 是一个开源的分布式位图索引,可以在多个海量数据集中显著加速查询。 它主要为速度和水平扩展性而设计。如果拥有数十亿的数据并且这些数据拥有数百万的属性,而你希望弄清楚其中的关系,那么 ...

收藏 10
Pilosa

没有更多内容

加载失败,请刷新页面

返回顶部
顶部