Amundsen 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
Amundsen 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
Amundsen 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 Apache 2.0
开发语言 Python
操作系统 跨平台
软件类型 开源软件
所属分类 大数据数据处理
开源组织 Linux 基金会
地区 不详
投 递 者 罗奇奇
适用人群 未知
收录时间 2022-08-07

软件简介

Amundsen 是一个数据发现和元数据引擎,用于提高数据分析师、数据科学家和工程师在与数据交互时的工作效率。

它通过索引数据资源(表、仪表板、流等)和基于使用模式(例如,查询次数多的表比次数少的表出现得更早)支持页面排名样式搜索来实现这一点。包括三个微服务、一个数据提取库和一个公共库。

  • amundsenfrontendlibrary:前端服务,它是一个带有 React 前端的 Flask 应用程序。
  • amundsensearchlibrary:利用 Elasticsearch 进行搜索功能的搜索服务用于支持前端元数据搜索。
  • amundsenmetadatalibrary:元数据服务,利用 Neo4j 或 Apache Atlas 作为持久层,提供各种元数据。
  • amundsendatabuilder : 用于构建元数据图和搜索索引的数据摄取库。用户可以使用带有库的 python 脚本或导入库的Airflow DAG加载数据。
  • amundsencommon:Amundsen Common 库包含 Amundsen 微服务之间的通用代码。
  • amundsengremlin:Amundsen Gremlin 库包含用于将模型对象转换为 gremlin 中的顶点和边的代码。它用于将数据加载到 AWS Neptune 后端。
  • amundsenrds:Amundsenrds 包含 ORM 模型以支持关系数据库作为 Amundsen 中的元数据后端存储。ORM 模型中的模式遵循数据构建器模型的逻辑。Amundsenrds 将用于数据构建器和元数据库,用于关系数据库的元数据存储和检索。 

主页

文档

要求

  • Python = 3.6 或 3.7
  • Node = v10 或 v12(v14 可能存在兼容性问题)
  • npm >= 6

入门

请访问 Amundsen 安装文档以 快速开始 使用虚拟数据引导默认版本的 Amundsen。

Amundsen 是 LF AI & Data Foundation 的孵化阶段项目。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣
暂无内容
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
3 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部