加载中

Linkis - 计算中间件

Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/...

收藏 457
更新于 2022/08/11
Linkis

PackOne - 大数据软件栈部署与管理工具

PackOne 致力于实现主流大数据软件在云端的快速弹性部署。通过对云 API 和 Apache Ambari API 的联合调用,完成 Hadoop、Spark、NiFi、PiFlow、Kyl...

收藏 142
更新于 2021/06/06
PackOne

GrimoireLab - 用于软件开发分析的工具集

GrimoireLab 是一个用于软件开发分析的工具集。它包括一组协调的工具,用于从支持软件开发(存储库)的系统中检索数据,将其存储在数据库中,通过计算相关指标来丰富它,并使其易于运行分析和可视...

收藏 86
更新于 2021/07/30
GrimoireLab

xarray - 在 NumPy 多维数组中加入变量名与坐标索引

xarray 是一个开源 Python 包,它可以使处理多维数组更加简单、高效并有趣。xarray 在原始类 NumPy 多维数组中引入了标签化的变量名称和坐标索引,实现了更直观、更简洁和更加不...

收藏 30
更新于 2021/05/20
xarray

OpenMetadata - 元数据开放标准

OpenMetadata 是元数据的开放标准,发现、协作和正确获取数据的单一场所。 OpenMetadata 包括以下内容: 元数据模式- 定义元数据的核心抽象和词汇表,其中包含类型、实体、实体...

收藏 16
OpenMetadata

Annoy - 求近似最近邻的库

Annoy 是 Spotify 开源的高维空间求近似最近邻的库,在 Spotify 使用它进行音乐推荐。最邻近搜索(Nearest Neighbor Search, NNS)又称为“最近点搜索”...

收藏 12
Annoy

Faust - Python 流处理

Faust 是一个流处理库,将想法从 Kafka Streams 移植到 Python。 它在 Robinhood 用于构建高性能的分布式系统和实时数据管道,每天处理数十亿个事件。 Faust ...

收藏 11
Faust

PyJava - Java/Scala 与 Python 数据转换库

PyJava 是一个用于在 Java/Scala 和 Python 之间转换数据的库。 PyJava 引入了 Apache Arrow 作为交换数据格式,这意味着可以避免 Java/Scala ...

收藏 9

Koalas - Apache Spark Pandas API

通过扩充Apache Spark的Python DataFrame API以与Pandas兼容,Koalas项目在与大数据交互时提高了数据科学家的工作效率。 Pandas是Python中事实上的...

收藏 6

wradlib - 天气雷达数据处理

python 天气雷达数据处理包。 wradlib 使用 Travis CI 进行持续集成。这意味着一旦将新代码推送到 wradlib 存储库,Travis 将运行一组测试。若测试顺利进行,将在...

收藏 6

Gamestonk Terminal - Python 投资研究工具

Gamestonk Terminal 是一个股票和加密市场的投资研究终端,为投资研究提供了一个基于 Python 的现代集成环境,允许交易者使用最先进的数据科学和机器学习技术。 作为一个现代的基...

收藏 6
Gamestonk Terminal

Coronavirus Tracker API - 跟踪新冠病毒感染情况的 API

Coronavirus Tracker API 是一个简单快速的 API,用于跟踪全球新冠病毒(SARS-CoV-2)的感染情况,包括有关确诊病例、死亡人数和康复人数。使用 FastAPI 框架...

收藏 4

Dagster - 数据编排器

Dagster 是一个用于机器学习、分析和 ETL 的数据编排器。 Dagster 让你以可重复使用的逻辑组件之间的数据流来定义管道,然后在本地测试并在任何地方运行。通过对管道和它们产生的资产的...

收藏 4
Dagster

Amundsen - 数据发现和元数据引擎

Amundsen 是一个数据发现和元数据引擎,用于提高数据分析师、数据科学家和工程师在与数据交互时的工作效率。 它通过索引数据资源(表、仪表板、流等)和基于使用模式(例如,查询次数多的表比次数少...

收藏 3
Amundsen

Big Data Sampling Under Chi-square - 基于卡方检验的大数据抽样工具

基于卡方检验的大数据抽样工具 介绍 抽样是数据科学中的基本方法之一。它可以降低数据规模并简化计算。本工具包给出一种保持分布不变性的抽样工具,使得即使在小样本数据量下也不会影响这些数据分析模型的准...

收藏 2
开源软件作者
wayfirer 作者
FileTools 作者
ThinServer 作者

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部