DevOps研发效能
媒体矩阵
开源中国APP
加载中

smallpond - 轻量级数据处理框架
编辑推荐
国内精选

smallpond 是一款构建于 DuckDB 和 3FS 之上的轻量级数据处理框架。 主要特性 拥有由 DuckDB 提供的高性能数据处理能力 支持扩展至 PB 级数据集 操作简便,无需长期运...

收藏 0

Wiseflow - 基于大模型的信息挖掘工具
国内精选

首席情报官(Wiseflow)是一个敏捷的信息挖掘工具,可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。 功能特色 原生 LLM 应用:精心选择...

收藏 6

ezdata - 数据处理分析和任务调度系统
国内精选

ezdata 是基于python后端和vue3前端开发的数据处理分析和任务调度系统。 其主要功能如下 多数据源管理,支持连接文件,关系型数据库,nosql数据库,时序数据库,图数据库等多种数据源...

收藏 8

PostgresML - 基于 PostgreSQL 的 AI 应用数据库
编辑推荐

PostgresML是PostgreSQL的机器学习扩展,能让你使用SQL查询对文本和表格数据进行训练和推理。有了PostgresML,你可以将机器学习模型无缝集成到PostgreSQL数据库中...

更新于 2023/12/07
收藏 32
PostgresML

OneTable - Lakehouse 表格式间全方位互操作

OneTable 是一种表格式的全方位转换器,可促进数据处理系统和查询引擎之间的互操作性。Apache Hudi、Delta Lake 和 Apache Iceberg 之间无缝互操作。 One...

更新于 2023/11/18
收藏 6
OneTable

esProc SPL - 数据分析引擎
编辑推荐
国内精选

esProc SPL 是一款面向结构化和半结构化数据的计算和处理引擎,可以用做分析型数据库和数据计算中间件。 esProc SPL 具有精心设计的丰富库函数和强大的语法,可通过 JDBC 接口在...

更新于 2023/10/16
收藏 17
esProc SPL

DIDI-ALITA - 基于图层的数据分析工具

ALITA(A Layered Instrument To Analysis)是一个基于分层分析来展示数据的工具,通过大量的业务需求沉淀抽象概括了“点”、“线”、“面”三种数据模型,完美融合地图...

收藏 1

FHIRModels - FHIR 资源数据模型 Swift 库

FHIRModels 是一个用于 FHIR® 资源数据模型的 Swift 库。 特征 FHIR 资源、元素和数据类型的本机 Swift 表示 DSTU2、STU3、R4、R4B、R5 和最新构建...

收藏 0

Quick Vector Editor - 桌面 GIS 矢量数据管理工具
国内精选

这是一款基于`Electron` 、`VUE` 、`OpenLayers` 、`jsts` 开发的桌面GIS矢量数据查看分析工具。现以完成功能: csv数据导入 shp数据导入 GeoJson数...

更新于 2023/06/13
收藏 5

Typical - 与代数数据类型的数据交换

Typical 是一个数据序列化框架。你在一个叫做 schema 的文件中定义数据类型,然后 Typical 为各种语言生成高效的序列化和反序列化代码。生成的代码可用于服务之间的消息编排,将结构...

收藏 2

CloudCanalProcess - CloudCanal SDK 数据处理器
国内精选

CloudCanal Data Process 是一款针对 CloudCanal SDK 的开源数据处理器,原生官方 SDK 只有一些说明文档。 本项目是由官方人员发起并与社区共同推进的自定义代...

更新于 2025/04/01
收藏 23

YTsaurus - Yandex 开源大数据平台

YTsaurus 是一个分布式存储和处理大数据的平台,支持 MapReduce 模型,带有一个分布式文件系统和一个 NoSQL 键值数据库。 平台优势: 多租户生态 一套相互关联的子系统:Map...

更新于 2023/03/26
收藏 7
YTsaurus

dynamicgo - 高性能动态化 Go 数据处理
国内精选

dynamicgo 是字节自研的一套能动态处理 RPC 数据(不需要代码生成)同时保证高性能的 Go 基础库,旨在减少序列化/反序列化过程。 dynamicgo 的核心设计思想是:基于 原始字节...

收藏 3

Wasm-bpf - WebAssembly eBPF 库和运行时
国内精选

Wasm-bpf 是一个 WebAssembly eBPF 库和运行时, 基于 CO-RE(一次编写 – 到处运行) libbpf 和 wasm-micro-runtime 实现。 Wasm 最...

更新于 2023/03/10
收藏 9

DataCap - 数据转换/集成/可视化
国内精选

DataCap是数据转换、集成和可视化的集成软件。支持各种数据源,如MySQL,ClickHouse,PostgreSQL,Apache Druid等. 官网地址:https://datacap...

更新于 2025/03/03
收藏 67
开源软件作者
MapstructPlus 作者
Cabloy.js 作者
ee-jsondb 作者

Amoro​​​​​​​ - 流式湖仓服务
国内精选

Amoro(原名 Arctic)是一个基于开放数据湖格式构建的 Lakehouse 管理系统。Amoro 与 Flink、Spark 和 Trino 等计算引擎合作,为 Lakehouse 带来...

更新于 2023/11/17
收藏 20
Amoro​​​​​​​

Amundsen - 数据发现和元数据引擎

Amundsen 是一个数据发现和元数据引擎,用于提高数据分析师、数据科学家和工程师在与数据交互时的工作效率。 它通过索引数据资源(表、仪表板、流等)和基于使用模式(例如,查询次数多的表比次数少...

收藏 5
Amundsen

Datashim - 数据集处理框架

Datrashim 是一个 Kubernetes 框架,它支持在 pod 中轻松访问 S3 和 NFS 数据集,以协调每个数据集所需的持久卷声明和 ConfigMap 的配置。 Datashim...

收藏 2

fq - 二进制数据解析工具

fq 是一个用于检查二进制数据的工具和解析器。 在大多数情况下,fq 的工作方式与 jq 相同,但它不是读取 JSON,而是读取二进制数据。结果是一个 JSON 兼容的结构,其中每个值都有一个位...

更新于 2022/05/09
收藏 29

Debezium - 变更数据捕获平台

Debezium 是一个为捕获数据更改 (Change Data Capture, CDC) 提供低延迟的流式处理平台,利用 Kafka 和 Kafka Connect 实现了持久性、可靠性和容...

更新于 2024/01/14
收藏 8

没有更多内容

加载失败,请刷新页面

返回顶部
顶部