加载中

Wiseflow - 基于大模型的信息挖掘工具

首席情报官(Wiseflow)是一个敏捷的信息挖掘工具,可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。 功能特色 原生 LLM 应用:精心选择...

收藏 5

ezdata - 数据处理分析和任务调度系统

ezdata 是基于python后端和vue3前端开发的数据处理分析和任务调度系统。 其主要功能如下 多数据源管理,支持连接文件,关系型数据库,nosql数据库,时序数据库,图数据库等多种数据源...

收藏 8

PostgresML - 基于 PostgreSQL 的 AI 应用数据库

PostgresML是PostgreSQL的机器学习扩展,能让你使用SQL查询对文本和表格数据进行训练和推理。有了PostgresML,你可以将机器学习模型无缝集成到PostgreSQL数据库中...

收藏 31
更新于 2023/12/07
PostgresML

Amundsen - 数据发现和元数据引擎

Amundsen 是一个数据发现和元数据引擎,用于提高数据分析师、数据科学家和工程师在与数据交互时的工作效率。 它通过索引数据资源(表、仪表板、流等)和基于使用模式(例如,查询次数多的表比次数少...

收藏 5
Amundsen

Gamestonk Terminal - Python 投资研究工具

Gamestonk Terminal 是一个股票和加密市场的投资研究终端,为投资研究提供了一个基于 Python 的现代集成环境,允许交易者使用最先进的数据科学和机器学习技术。 作为一个现代的基...

收藏 7
Gamestonk Terminal

Dagster - 数据编排器

Dagster 是一个用于机器学习、分析和 ETL 的数据编排器。 Dagster 让你以可重复使用的逻辑组件之间的数据流来定义管道,然后在本地测试并在任何地方运行。通过对管道和它们产生的资产的...

收藏 4
Dagster

Big Data Sampling Under Chi-square - 基于卡方检验的大数据抽样工具

基于卡方检验的大数据抽样工具 介绍 抽样是数据科学中的基本方法之一。它可以降低数据规模并简化计算。本工具包给出一种保持分布不变性的抽样工具,使得即使在小样本数据量下也不会影响这些数据分析模型的准...

收藏 2

OpenMetadata - 元数据开放标准

OpenMetadata 是元数据的开放标准,发现、协作和正确获取数据的单一场所。 OpenMetadata 包括以下内容: 元数据模式- 定义元数据的核心抽象和词汇表,其中包含类型、实体、实体...

收藏 17
OpenMetadata

Apache StreamPark - 流处理极速开发框架

StreamX 是一个 Apache Flink 极速开发框架。项目的初衷是 —— 让 Flink 开发更简单。 StreamX 定位是 Flink|Spark 开发脚手架 + 流批一体大数据平...

收藏 53
更新于 2024/05/17
Apache StreamPark

Txtai - 人工智能驱动的搜索引擎

Txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立了一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问-答的系统。此外,txtai 还具有用于 ...

收藏 84
更新于 2023/02/08
Txtai

Coronavirus Tracker API - 跟踪新冠病毒感染情况的 API

Coronavirus Tracker API 是一个简单快速的 API,用于跟踪全球新冠病毒(SARS-CoV-2)的感染情况,包括有关确诊病例、死亡人数和康复人数。使用 FastAPI 框架...

收藏 4

wradlib - 天气雷达数据处理

python 天气雷达数据处理包。 wradlib 使用 Travis CI 进行持续集成。这意味着一旦将新代码推送到 wradlib 存储库,Travis 将运行一组测试。若测试顺利进行,将在...

收藏 6

Annoy - 求近似最近邻的库

Annoy 是 Spotify 开源的高维空间求近似最近邻的库,在 Spotify 使用它进行音乐推荐。最邻近搜索(Nearest Neighbor Search, NNS)又称为“最近点搜索”...

收藏 13
Annoy

Faust - Python 流处理

Faust 是一个流处理库,将想法从 Kafka Streams 移植到 Python。 它在 Robinhood 用于构建高性能的分布式系统和实时数据管道,每天处理数十亿个事件。 Faust ...

收藏 11
Faust

PyJava - Java/Scala 与 Python 数据转换库

PyJava 是一个用于在 Java/Scala 和 Python 之间转换数据的库。 PyJava 引入了 Apache Arrow 作为交换数据格式,这意味着可以避免 Java/Scala ...

收藏 9
开源软件作者
CppTexturePacker 作者
MiNiFi 作者
Art Mustache 作者

GrimoireLab - 用于软件开发分析的工具集

GrimoireLab 是一个用于软件开发分析的工具集。它包括一组协调的工具,用于从支持软件开发(存储库)的系统中检索数据,将其存储在数据库中,通过计算相关指标来丰富它,并使其易于运行分析和可视...

收藏 85
更新于 2021/07/30
GrimoireLab

Linkis - 计算中间件

Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/...

收藏 462
更新于 2024/01/05
Linkis

xarray - 在 NumPy 多维数组中加入变量名与坐标索引

xarray 是一个开源 Python 包,它可以使处理多维数组更加简单、高效并有趣。xarray 在原始类 NumPy 多维数组中引入了标签化的变量名称和坐标索引,实现了更直观、更简洁和更加不...

收藏 28
更新于 2021/05/20
xarray

PackOne - 大数据软件栈部署与管理工具

PackOne 致力于实现主流大数据软件在云端的快速弹性部署。通过对云 API 和 Apache Ambari API 的联合调用,完成 Hadoop、Spark、NiFi、PiFlow、Kyl...

收藏 138
更新于 2021/06/06
PackOne

Koalas - Apache Spark Pandas API

通过扩充Apache Spark的Python DataFrame API以与Pandas兼容,Koalas项目在与大数据交互时提高了数据科学家的工作效率。 Pandas是Python中事实上的...

收藏 6

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部