gStore 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
gStore 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
gStore 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
gStore 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
gStore 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !

软件简介

gStore是一个面向RDF知识图谱的图数据库系统(通常称为Triple Store)。

知识图谱数据管理的一个核心问题是如何有效地存储RDF数据集和快速回答SPARQL查询。总的来说,有两套完全不同的思路。其一是可以利用已有的成熟的数据库管理系统(例如关系数据库系统)来存储知识图谱数据,将面向RDF知识图谱的SPARQL查询转换为面向此类成熟数据库管理系统的查询,例如面向关系数据库的SQL查询,利用已有的关系数据库产品或者相关技术来回答查询。这里面最核心的研究问题是如何构建关系表来存储RDF知识图谱数据,并且使得转换的SQL查询语句查询性能更高;其二是直接开发面向RDF知识图谱数据的Native的知识图谱数据存储和查询系统(Native RDF图数据库系统),考虑到RDF知识图谱管理的特性,从数据库系统的底层进行优化。

不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(Native Graph Model),维持了原始RDF知识图谱的图结构;其数据模型是有标签、有向的多边图,每个顶点对应着一个主体或客体。gStore系统将RDF和SPARQL分别表示成图的形式,利用子图匹配的方法来回答SPARQL查询,并且利用基于图结构的索引(VS-tree)来加速查询的性能。 例如在RDF中,主体和客体可以分别表示成RDF图中的节点,一条称述(即RDF三元组)可以表示成一条边,其中谓词是边的标签。SPARQL语句同样可以表示成一个查询图。 

image

RDF图和SPARQL查询图

gStore图数据库的优势:

  1. 拥有自主研发的核心图数据库系统技术;
  2. 对RDF知识图谱数据文件原生支持;
  3. 引擎对于图查询/分析的原生支持;
  4. 支持描述性(而非过程化)查询语言;
  5. 性能:秒级多跳查询;
  6. 支持跨复杂数据的关联分析。

性能测试

国家权威的第三方软件测评机构对gStore性能进行了对比测试,测试结果表明在国际通用的图数据评测数据集上,与Neo4j,Virtuoso,Jena,JanusGraph等4种目前市场上主流图数据库进行了对比测试,测试结果表明gStore的数据查询性能具有明显优势

中国软件测评中心对分布式gStore存储容量和gStore的查询性能进行了严格测试,验证了分布式gStore支持百亿规模三元组数据,且平均查询响应时间仅为1.797秒。

gStore 拥有以下特性:

  1. gStore从图数据库角度存储和检索RDF知识图谱数据;
  2. gStore支持W3C定义的SPARQL 1.1标准,包括含有Union,OPTIONAL,FILTER和聚集函数的查询;gStore支持有效的增删改操作;
  3. gStore单机可以支持1Billion(十亿)三元组规模的RDF知识图谱的数据管理任务;

关于gStore的核心学术思路,请参考gStore所发表的论文

gStore 应用案例

1. 金融知识图谱项目——多层股权查询示例

2. 政府大数据——亲属关系检索(用于民政和司法)

 

3. 智能问答机器人

4. 智慧医疗——基于医疗知识图谱的问答

gStore可下载资源

  1. gStore(单机版):http://www.gstore-pku.com/pcsite/download-1.html
  2. gStore Workbench:http://www.gstore-pku.com/pcsite/download-2.html
  3. gStore云端:http://cloud.gstore.cn/
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
暂无内容
发表了博客
2019/05/17 11:29

一个基于图的数据管理系统-gStore

gStore是遵循 BSD协议的一个开源项目。一个基于图的 RDF 三元组存储的数据管理系统。该项目是北京大学、滑铁卢大学、香港科技大学的联合研究项目。中国北京大学计算机科学与技术研究所的数据库组对该系统进行开发和维护。目前尚未商业化,需通过技术转让或授权使用。 gStore从图数据库角度存储和检索RDF知识图谱数据. gStore支持W3C定义的SPARQL1.1标准,包含Union,OPTIONAL,FILTER和聚集函数查询;gStore支持有效的增删改操作 ...

0
0
发表了博客
2020/07/19 15:54

麒麟Kylin系统适配gStore图数据库系统

麒麟Kylin系统适配gStore图数据库系统 作者: 梁剑明 日期: 2020年07月17日 适配系统版本 :Kylin 4.0 内核版本 :aarch64 gStore版本 :V0.8 1.环境要求 适配gStore图数据库系统V0.8版本,环境需求如下: 项目 需求 操作系统 Linux, 例如CentOS, Ubuntu、Kylin等 架构 x86_64 磁盘容量 根据数据集的大小 内存大小 根据数据集的大小 glibc 必须安装 version >= 2.14 gcc 必须安装 version >= 4.8 g++ 必须安装 version >= 4.8...

0
0
2017/10/22 01:21

centos7 安装简单vsftpd,本地用户,禁止匿名

一、关闭 sellinux 查看SELinux状态: 1、/usr/sbin/sestatus -v ##如果SELinux status参数为enabled即为开启状态SELinux status: enabled 关闭SELinux: 1、临时关闭(不用重启机器): setenforce 0 ##设置SELinux 成为permissive模式 ##setenforce 1 设置SELinux 成为enforcing模式 2、修改配置文件需要重启机器: 修改/etc/selinux/config 文件 将SELINUX=enforcing改为SELINUX=disabled 重启机器即可,不关闭SELinux 会出些...

0
0
发表了博客
2020/10/24 01:47

【1024福利】北大、腾讯、蚂蚁金服专家分享知识图谱应用场景

知识图谱和深度学习一样是人工智能的一个关键技术。百度CTO王海峰说“知识图谱是让机器像人类一样理解客观世界的基石” 百度 AI 多年技术积累和业务实践的集大成是百度大脑,百度大脑发展了近 10 年的时间,其中的知识图谱技术是从 2013 年开始做的。一方面知识图谱的规模在快速增长,另一方面,基于知识图谱来提供服务,每天满足用户各种需求的量级也在快速增加。过去这些年,百度知识图谱的服务规模大概增长了490倍。 人工智能...

0
0
发表了博客
2018/12/12 17:55

Kaggle: Google Analytics Customer Revenue Prediction EDA

前言 内容提要 本文为Kaggle竞赛 Google Analytics Customer Revenue Prediction 的探索性分析 题目要求根据历史顾客访问GStore的数据,预测其中部分顾客在未来的销售额,且预测期与原数据之间不连续 主要切入角度为针对待预测的问题,估计出答案的合理区间(数量级水平) 项目介绍 项目说明:Google Analytics Customer Revenue Prediction 预测目标(新):根据顾客的点击信息数据(2016.8.1 - 2018.10.15),预测2018.5.1 - ...

0
0
发表于数据库专区
2020/05/16 14:31

Wikipedia – Graph Database

From Wikipedia, the free encyclopedia In computing, a graph database is a database that uses graph structures for semantic queries with nodes, edges and properties to represent and store data. A key concept of the system is the graph (or edge or relationship), which directly relates data items in the store. The relationships allow data in the store to be linked together directly, and in many ca...

0
0
2020/07/04 10:48

【赠书】超厚的知识图谱,送4本!

周末要到了,这次给大家赠送4本知识图谱的书籍,这一次的赠书有点不一样,因为这一次包括了两本不一样的书籍,都来自于电子工业出版社,分别是《知识图谱-概念与技术》以《知识图谱-方法、实践与应用》,下面首先看看到底有何不同。 《知识图谱-方法,实践与应用》 本书由语义网和知识图谱领域有10余年研究和开发经验的3位专家共同编著,是一本包括了知识图谱理论方法以及实践方法的书籍,能够帮助你快速熟悉知识图谱学科体系,...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
19 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部