HugeGraph 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
HugeGraph 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
HugeGraph 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
HugeGraph 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
HugeGraph 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !

软件简介

HugeGraph 是一款易用、高效、通用的开源图数据库系统(Graph Database), 实现了 Apache TinkerPop3 框架及完全兼容 Gremlin 查询语言, 具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。HugeGraph 支持百亿以上的顶点和边快速导入,并提供毫秒级的关联关系查询能力(OLTP), 并可与 Hadoop、Spark 等大数据平台集成以进行离线分析(OLAP)。

HugeGraph 典型应用场景包括深度关系探索、关联分析、路径搜索、特征抽取、数据聚类、社区检测、 知识图谱等,适用业务领域有如网络安全、电信诈骗、金融风控、广告推荐、社交网络和智能机器人等。

本系统的主要应用场景是解决百度安全事业部所面对的反欺诈、威胁情报、黑产打击等业务的图数据存储和建模分析需求,在此基础上逐步扩展及支持了更多的通用图应用。

主要特性

HugeGraph 支持在线及离线环境下的图操作,支持批量导入数据,支持高效的复杂关联关系分析,并且能够与大数据平台无缝集成。 HugeGraph 支持多用户并行操作,用户可输入 Gremlin 查询语句,并及时得到图查询结果,也可在用户程序中调用 HugeGraph API 进行图分析或查询。

本系统具备如下特点:

  • 易用:HugeGraph 支持 Gremlin 图查询语言与 Restful API,同时提供图检索常用接口,具备功能齐全的周边工具,轻松实现基于图的各种查询分析运算。
  • 高效:HugeGraph 在图存储和图计算方面做了深度优化,提供多种批量导入工具,轻松完成百亿级数据快速导入,通过优化过的查询达到图检索的毫秒级响应。支持数千用户并发的在线实时操作。
  • 通用:HugeGraph 支持 Apache Gremlin 标准图查询语言和 Property Graph 标准图建模方法,支持基于图的 OLTP 和 OLAP 方案。集成 Apache Hadoop 及 Apache Spark 大数据平台。
  • 可扩展:支持分布式存储、数据多副本及横向扩容,内置多种后端存储引擎,也可插件式轻松扩展后端存储引擎。
  • 开放:HugeGraph 代码开源(Apache 2 License),客户可自主修改定制,选择性回馈开源社区。

本系统的功能包括但不限于:

  • 支持从多数据源批量导入数据(包括本地文件、HDFS 文件、MySQL 数据库等数据源),支持多种文件格式导入(包括 TXT、CSV、JSON 等格式)
  • 具备可视化操作界面,可用于操作、分析及展示图,降低用户使用门槛
  • 优化的图接口:最短路径(Shortest Path)、K 步连通子图(K-neighbor)、K步到达邻接点(K-out)、个性化推荐算法 PersonalRank 等
  • 基于 Apache TinkerPop3 框架实现,支持 Gremlin 图查询语言
  • 支持属性图,顶点和边均可添加属性,支持丰富的属性类型
  • 具备独立的 Schema 元数据信息,拥有强大的图建模能力,方便第三方系统集成
  • 支持多顶点 ID 策略:支持主键 ID、支持自动生成 ID、支持用户自定义字符串 ID、支持用户自定义数字 ID
  • 可以对边和顶点的属性建立索引,支持精确查询、范围查询、全文检索
  • 存储系统采用插件方式,支持 RocksDB、Cassandra、ScyllaDB、HBase、MySQL、PostgreSQL、Palo 以及 InMemory 等
  • 与 Hadoop、Spark GraphX 等大数据系统集成,支持 Bulk Load 操作
  • 支持高可用 HA、数据多副本、备份恢复、监控等

组件

  • HugeGraph-Server: HugeGraph-Server 是 HugeGraph 项目的核心部分,包含 Core、Backend、API 等子模块;
    • Core:图引擎实现,向下连接 Backend 模块,向上支持 API 模块;
    • Backend:实现将图数据存储到后端,支持的后端包括:Memory、Cassandra、ScyllaDB、RocksDB、HBase 及 MySQL,用户根据实际情况选择一种即可;
    • API:内置 REST Server,向用户提供 RESTful API,同时完全兼容 Gremlin 查询。
  • HugeGraph-Client:HugeGraph-Client 提供了 RESTful API 的客户端,用于连接 HugeGraph-Server,目前仅实现 Java 版,其他语言用户可自行实现;
  • HugeGraph-Loader:HugeGraph-Loader 是基于 HugeGraph-Client 的数据导入工具,将普通文本数据转化为图形的顶点和边并插入图形数据库中;
  • HugeGraph-Spark:HugeGraph-Spark 能在图上做并行计算,例如 PageRank 算法等;
  • HugeGraph-Studio:HugeGraph-Studio 是 HugeGraph 的 Web 可视化工具,可用于执行 Gremlin 语句及展示图;
  • HugeGraph-Tools:HugeGraph-Tools 是 HugeGraph 的部署和管理工具,包括管理图、备份/恢复、 Gremlin 执行等功能。

界面展示

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (11)

加载中
yun
胡歌?
03/15 14:44
回复
举报
有些功能要收费版本才能用
03/15 09:41
回复
举报
使用此数据库存储和使用建筑信息模型是否合适?
2020/11/13 23:05
回复
举报
作者,你好,我安装的hugegraph-0.10.0 版本,展示界面和你的不一样
2020/06/06 00:35
回复
举报
作者好,我想问下有首页界面的安装文档?按照文章中的文档部署只能看到图数据库界面,没有首页界面的安装文档
2019/12/05 10:54
回复
举报
按照你提供的官方文档部署好hugegraph studio可视化系统后 和你这个系统不一样 你的这个系统部署文档在哪
2019/12/05 10:05
回复
举报
界面和neo4j有点像,是基于neo4j开发的么
2019/12/02 15:30
回复
举报
存储就不一样,neo4j等使用自己的原生图存储,这个没有自己的存储,采用插件方式支持多种数据库。
2019/12/04 22:18
回复
举报
那就是一个图客户端工具了,严格意义上不能说是图数据库系统
2019/12/05 09:53
回复
举报
多种数据库只是数据源和存储,核心是图引擎。
2019/12/05 21:26
回复
举报
赞👍🏻
2019/11/15 16:57
回复
举报
更多评论
发表了资讯
04/01 15:34

HugeGraph 图数据库获 Apache TinkerPop 官方认证

Apache软件基金会(Apache Software Foundation, ASF)是世界上最大的开源软件基金会,Apache目前拥有超过350个开源项目。 TinkerPop 是Apache基金会旗下的顶级项目,是一个面向实时事务处理以及批量、分析型图分析的图计算框架,其核心模块是TinkerPop Gremlin引擎。百度安全自研的图数据库HugeGraph实现了Apache TinkerPop3框架及完全兼容Gremlin查询语言,近期得到Apache TinkerPop的正式官方认证,并纳入其提供商列表大力推...

2
8
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
2019/01/28 16:55

HugeGraph入门

一、HugeGraph简介 最近在搞好友推荐方便的工作,选择了图数据的方法,使用并学习了HugeGraph,再次记录一下。 HugeGraph是百度在2018年中旬开源的一款图数据库(Graph Database)系统,可以存储海量的顶点(Vertex)和边(Edge)。实现了Apache ThinkerPop 3[^1]框架,支持Gremlin图查询语言[^2]。HugeGraph支持多用户并行操作,用户可输入Gremlin查询语句,并及时得到图查询结果。也可以再用户程序中调用hugeGraph API进行图分...

0
0
发表于数据库专区
2020/03/30 13:34

HugeGraph图数据库各类索引功能对比

HugeGraph Database Index HugeGraph图数据库的索引支持比较全面,图数据库的索引一般包括几方面: - 图索引/边索引(graph-index):主要用于加速获取顶点的关联边,一般使用邻接表或十字链表等方式,也可以使用hash索引。hugegraph使用的是邻接表。 - 超级点索引(vertex-centric-index):主要用于加速获取超级顶点的部分关联边,比如查询12315号码这个点最近一周的通话边。hugegraph通过sortkey实现的,相当于增强版邻接表。...

0
0
发表于数据库专区
2018/08/03 21:30

百度安全开源大规模图数据库HugeGraph

图数据库在安全反欺诈、知识图谱、机器学习等诸多领域有着重要的应用,但TitanDB团队被DataStax收购之后,开源图数据库出现了断层。近年来百度安全凭着雄厚的技术实力自主研发了全面支持Apache TinkerPop 3框架和Gremlin图查询语言的大型分布式图数据库HugeGraph,与Neo4j、TitanDB等传统图数据库相比有很多独特的优势。今天我们很高兴的宣布HugeGraph开源,更好的为网络安全、机器学习等社区服务。 HugeGraph主要应用场景是解决...

0
0
发表于数据库专区
2020/12/11 17:59

HugeGraph发布可视化平台Hubble首个版本

近日,大规模图数据库HugeGraph宣布,正式发布图可视化分析平台 HugeGraph-Hubble v1.5 版本。该版本全面升级平台可视化工具,打造一站式图服务,从数据建模,到数据快速导入,再到数据的在线、离线分析,以及图的统一管理,实现了图应用全流程的向导式操作,旨在提升社区用户的使用顺畅度,降低使用门槛,提供更为高效易用的使用体验。 HugeGraph是一款面向分析型,支持批量操作的图数据库系统,它由百度安全团队自主研发,全面...

1
0
2020/08/27 15:16

图数据库对比:Neo4j vs Nebula Graph vs HugeGraph

![性能测试对比](https://www-cdn.nebula-graph.com.cn/nebula-blog/performance-comparison.png) > 本文系腾讯云安全团队李航宇、邓昶博撰写 图数据库在挖掘黑灰团伙以及建立安全知识图谱等安全领域有着天然的优势。为了能更好的服务业务,选择一款高效并且贴合业务发展的图数据库就变得尤为关键。本文挑选了几款业界较为流行的开源图数据库与 [Nebula Graph](https://0x7.me/tsecurity2github) 进行了多角度的对比。 ## 图数据...

5
6
发表了博客
2020/08/28 13:26

图数据库对比:Neo4j vs Nebula Graph vs HugeGraph

0
0
发表了博客
2020/03/22 18:53

linux环境安装可操作图库语言Gremlin的图框架HugeGraph

原创/朱季谦 若你还没接触过图数据库,可能看到这个概念时,会比较蒙蔽。 图是什么?图数据库又是什么? 首先,在数据结构中,图是一种由顶点(vertex)集合及顶点间关系集合组成的一种非线性数据结构。 而图数据库,则是以图这种具有点边结构来增、删、改、查之类操作的NoSQL数据库,它特别擅长处理大数据之间的关联。 常见的图数据库有Neo4j,JanuasGraph,Tigergraph等,其中,Gremlin是一种操作图数据库的图语言,它是Apache ...

0
0
2020/05/31 22:26

一文看尽图数据库选型,30多个指标全面比较Neo4j、HugeGraph、JanusGraph

图数据库(Graph Database)是一种以图结构进行存储和查询的数据库。本文总结了图数据库选型的各类因素,并对比了3个主流开源图数据库:Neo4j、JanusGraph、HugeGraph。Neo4j是老牌的图数据库,JanusGraph是非常成功的开源图数据库TitanDB的Fork版(TitanDB已经不维护了),HugeGraph是百度开源的图数据库。下面表格是具体的对比内容,共比较了30多个指标,包括生态、功能、性能、工具链等维度,分享出来给大家作为参考: ●http协...

0
0
发表了博客
2020/05/31 22:26

一文看尽图数据库选型,30多个指标全面比较Neo4j、HugeGraph、JanusGraph

图数据库(Graph Database)是一种以图结构进行存储和查询的数据库。本文总结了图数据库选型的各类因素,并对比了3个主流开源图数据库:Neo4j、JanusGraph、HugeGraph。Neo4j是老牌的图数据库,JanusGraph是非常成功的开源图数据库TitanDB的Fork版(TitanDB已经不维护了),HugeGraph是百度开源的图数据库。下面表格是具体的对比内容,共比较了30多个指标,包括生态、功能、性能、工具链等维度,分享出来给大家作为参考: ●http协...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表于数据库专区
2020/03/18 08:53

高手问答第 241 期 —— 图数据库开发与应用实战分享

当前,互联网数据呈指数级增长,集中表现在数据量级的飞越和数据关联的复杂化加深。对于企业而言,如何如何通过挖掘大数据的关联性去探索“隐藏”在背后的价值变得越发重要。 然而,传统的关系型数据库,在处理复杂数据关系运算上表现很差,随着数据量和深度的增加,关系型数据库无法在有效的时间内计算出结果。所以,为了更好地利用数据间的连接,企业需要一种——将关系信息存储为实体、灵活拓展数据模型的数据库技术,这项技...

53
18
发表于数据库专区
2020/03/11 14:23

百度开源的HugeGraph相比其它图数据库的优势是什么?

各位大牛,有没有用过百度开源的图数据库HugeGraph,具体怎么样,求解答啊

4
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
11 评论
282 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部