加载中

WizMap - 浏览器交互式可视化大型 embedding 解释工具

WizMap 是一个交互式可视化大型 embedding 解释和查找工具,并且直接在浏览器中使用。 机器学习模型通常学习潜在的 embedding 表示,这些表示捕获其训练数据的域语义。这些嵌入...

收藏 4
WizMap

Trino - 大数据分布式 SQL 查询引擎

Trino(前身为 PrestoSQL)被设计用于处理数据仓库和分析:数据分析,聚合大量数据和生成报告。这些工作负载通常被分类为在线分析处理(OLAP)。 Trino不是一个通用的关系数据库,它...

收藏 3
Trino

ParadeDB - 基于 Postgres 的 ElasticSearch 替代方案

ParadeDB 是基于 Postgres 构建的开源 ElasticSearch 替代方案。开发团队正在构建 ElasticSearch 产品套件的功能,首先是搜索。 ParadeDB 提供所...

收藏 20
更新于 2024/01/08
ParadeDB

ES-Fastloader - 离线数据索引生成方案

ES-Fastloader 是一种能够快速地为海量离线数据生成索引的方案,采用了一种 Build & Push 的机制,利用 Hadoop 强大的并行计算能力,可在 1-2 小时内极快速构建几十...

收藏 2
ES-Fastloader

Quickwit - 云原生分布式搜索引擎

Quickwit 是一个用于日志管理和分析的开源、云原生、分布式搜索引擎。Quickwit 用 Rust 编写,从头开始设计,可在大型数据集上提供成本效益和高可扩展性,是 Elasticsear...

收藏 7
Quickwit

ZincSearch - 轻量级的 Elasticsearch 替代方案

Zinc 是一个使用 Golang 编写的全文索引搜索引擎,可作为 Elasticsearch 的轻量级替代品,Zinc 可运行在不到 100MB 的 RAM 中。它使用 bluge 作为底层索...

收藏 43
更新于 2022/08/22

DataHub - 元数据管理平台

DataHub 是用于处理元数据的管理平台,它可充当数据发现工具(即数据目录),来找出公司中存在哪些数据集,以及如何使用这些数据集进行测试。 特性 支持在数据库、数据湖、BI 平台、ML特征存储...

收藏 43
更新于 2021/12/12
DataHub

Typesense - 搜索引擎

Typesense 是一种快速、可容忍错字的搜索引擎,用于构建令人愉悦的搜索体验。 开源 Algolia 替代方案和更易于使用的 ElasticSearch 替代方案。 特征 Typo Tole...

收藏 34
更新于 2021/06/26
Typesense

Logica - 逻辑编辑语言

Logica,一种新的开源逻辑编程语言。 Logica 是 Yedalog(Google 早期开发的一种语言)的继承者,是一种类似于 Datalog 的逻辑编程语言。其代码会编译成 SQL,并在...

收藏 4
更新于 2021/04/13

OpenSearch - 分布式搜索和分析引擎

OpenSearch 项目由 OpenSearch (fork Elasticsearch 7.10.2) 和 OpenSearch Dashboards (fork Kibana 7.10.2...

收藏 33
更新于 2024/09/18
OpenSearch

openLooKeng - 高性能数据虚拟化引擎

openLooKeng 是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源/数据中心分析能力以及面向交互式、批、流等融合查询场景。同时增强了前置调度、跨源索引、动态过滤、跨源协同、...

收藏 127
更新于 2022/01/29
openLooKeng

Apache Iceberg - 跟踪超大规模表的新格式

Apache Iceberg 是一种新的表格格式,用于存储和分析大型的、移动缓慢的表格数据。它的工作方式类似于 SQL 表,它旨在改进内置在 Hive、Presto 和 Spark 中的事实上的...

收藏 48
更新于 2020/05/28
Apache Iceberg

corona-cli - COVID-19 疫情报告命令行

corona-cli 是一个跟踪新型冠状病毒肺炎(COVID-19)的命令行工具。 特点: 响应时间 < 100ms 获取全球 COVID-19 报告 每天主动报告选定国家的 COVID-19 ...

收藏 17

pgcmd - 非交互式 PostgreSQL 查询工具

pgcmd 是非交互式 PostgreSQL 查询工具。它输出 JSON,这意味着可以使用 jq 或 catj 等工具处理和查看结果。 安装 npm install -g pgcmd 用...

收藏 13

AresDB - 基于 GPU 运算的实时分析存储引擎和查询引擎

AresDB 是 Uber 开源的一个基于 GPU 运算的实时分析存储引擎和查询引擎。具备低查询延迟、高数据刷新率和高效内存和磁盘存储管理。AresDB 要求 CUDA Toolkit 的支持。...

收藏 45
更新于 2019/01/31
AresDB
开源软件作者
NetQuiet 作者
quartz web 作者
Bouyei.NetFactory 作者

OpenFEA - 可视化大数据分析挖掘工具

一、简介 FEA是一站式大数据敏捷分析中间件,融合了内存计算、机器学习、交互分析、可视化分析等技术,涵盖数据收集、数据探索、构建模型、发布模型、可视化展示、分析门户等功能,无需复杂编程即可快速实...

收藏 285
更新于 2017/06/01

Pilosa - 开源的分布式位图索引

Pilosa 是一个开源的分布式位图索引,可以在多个海量数据集中显著加速查询。 它主要为速度和水平扩展性而设计。如果拥有数十亿的数据并且这些数据拥有数百万的属性,而你希望弄清楚其中的关系,那么 ...

收藏 18
Pilosa

Elasticsearch - 分布式搜索引擎

Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎,能够解决越来越多的用例。作为 Elastic Stack 的核心,它集中存储您的数据,帮助您发现意料之中以及...

收藏 1495
更新于 2024/11/25
Elasticsearch

apollo-server

A TypeScript GraphQL Server for Express, Koa, Hapi, Lambda, and more. Apollo Server is a communit...

收藏 0

graphql-upload

graphql-upload Middleware and an Upload scalar to add support for GraphQL multipart requests (fil...

收藏 0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部