gStore系统的重新设计

2018 年 7 月 2 日 FCS

点击上方蓝字

关注我们

导读


       gStore是一种开源的RDF存储系统,通过子图匹配的方式来响应SPARQL查询。但在原来的系统中,存在很多导致性能不佳的设计,比如响应简单查询的策略。在本文的工作中,将对gStore系统进行重新设计,来提高查询响应的性能。本文建立了一个查询策略选择模块,针对不同的查询结构,将生成最适合的查询处理计划。此外,本文重新设计了一种可以提高过滤能力的节点编码策略,以及一种可以加速子图匹配的多路拼接算法。在人工数据集和真实数据集上的大量实验,证明了本文方法的有效性,性能远远超越了目前最好的算法。

作者简介

        邹磊北京大学计算机科学技术研究所教授,国家自然科学基金优秀青年基金项目获得者,北京大学大数据中心主任助理。邹磊分别于2003年和2009年毕业于华中科技大学计算机科学与技术学院,获得工学学士和工学博士学位;2009年9月加入北京大学计算机科学技术研究所。其博士学位论文获得2009年中国计算机学会优秀博士学位论文提名奖和湖北省优秀博士论文奖。他目前的研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理,已经发表了50余篇国内外学术论文,包括CCF-A类的数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近30篇;主持研发了面向知识图谱数据的图数据库系统gStore和知识图谱问答平台gAnswer。2014年所主持的项目“海量图结构数据存储和查询优化理论研究”,获得中国计算机学会自然科学二等奖(邹磊排名第一)。2017年所支持的项目“大规模图结构数据管理”获得教育部自然科学二等奖(邹磊排名第一)。邹磊承担了包括国家自然基金、国家重点研发项目等多项国家科研攻关项目;其研究也到了包括微软、腾讯和方正电子等产业界公司的资助。

文章精要

      请长按下方二维码识别,阅读该文。

相关文章推荐:

FCS 12(1) 文章 | 处理大规模索引中的查询偏斜:一种基于视图的方法

FCS 12(1) 文章 | 基于双线性配对的高效身份门限解密方案

FCS 11(6) 文章 | 从大众分类法语料库挖掘用户偏好的概率框架

FCS 11(6) 文章 | 基于简历网络的个人信息摘要生成

FCS 11(5) 文章 | 用于联合自动机建模与控制的代数状态空间法

FCS 11(4) 文章 | 关于内容相关的条件函数依赖的规则发现

FCS 11(4) 文章 | 时间敏感的转化率预测

FCS 11(2) 文章 | 吸引中国“Y世代”购买手机应用程序的因素

FCS 11(2) 文章 | 基于创新索引技术的多阈值字符串相似性连接

       FCS「优青论坛」由主编李未院士,执行主编熊璋教授和周志华教授发起,以综述论文的形式,集中展现「NSFC 优秀青年基金」获得者对所研究领域的分析和见解,介绍最新的研究进展和成果。



Frontiers of Computer Science



Frontiers of Computer Science 是由教育部主管、高等教育出版社和德国 Springer 公司共同出版的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”。



长按二维码关注Frontiers of Computer Science公众号

登录查看更多
1

相关内容

邹磊,北京大学计算机科学技术研究所教授、国家自然科学基金委优秀青年基金项目获得者,北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。邹磊及其团队构建了面向海量RDF知识图谱数据(超过100亿三元组规模)的开源图数据库系统。邹磊已经发表了30余篇国内外学术论文,包括数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近20余篇;其论文被引用超过1200多次(根据Google Scholar的统计),单篇最高被引用298余次。邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖(排名第一)。个人主页:http://www.icst.pku.edu.cn/leizou/index.htm
FPGA加速系统开发工具设计:综述与实践
专知会员服务
63+阅读 · 2020年6月24日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【阿里巴巴-CVPR2020】频域学习,Learning in the Frequency Domain
专知会员服务
35+阅读 · 2019年12月13日
分布式智能计算系统前沿
中国计算机学会
18+阅读 · 2019年10月8日
【北大】知识图谱的关键技术及其智能应用
专知
111+阅读 · 2019年9月19日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
基于统计关系学习的自动数据清洗
FCS
7+阅读 · 2019年3月1日
基于差分隐私的地理社交网络发布
FCS
9+阅读 · 2019年2月22日
刘升平 | 基于知识图谱的人机对话系统
开放知识图谱
11+阅读 · 2018年10月24日
FCS 12(1) 文章 | 知识图谱综述
FCS
7+阅读 · 2018年3月12日
Arxiv
11+阅读 · 2018年7月31日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2017年10月1日
VIP会员
相关资讯
分布式智能计算系统前沿
中国计算机学会
18+阅读 · 2019年10月8日
【北大】知识图谱的关键技术及其智能应用
专知
111+阅读 · 2019年9月19日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
基于统计关系学习的自动数据清洗
FCS
7+阅读 · 2019年3月1日
基于差分隐私的地理社交网络发布
FCS
9+阅读 · 2019年2月22日
刘升平 | 基于知识图谱的人机对话系统
开放知识图谱
11+阅读 · 2018年10月24日
FCS 12(1) 文章 | 知识图谱综述
FCS
7+阅读 · 2018年3月12日
Top
微信扫码咨询专知VIP会员