图数据库已经成为管理复杂且互联数据的重要工具,这类数据在社交网络、生命信息学和推荐系统等领域中尤为常见。与传统的关系型数据库不同,图数据库提供了一种更自然的方式来建模和查询复杂的关系,使其在处理互联数据时,尤其是在要求灵活性和高效性的应用中,表现得尤为出色。 尽管图数据库的使用日益增加,但它们仍面临显著的挑战。一个主要的问题是图数据的不规则性,通常表现为结构稀疏,例如在邻接矩阵表示中,这可能导致数据读写操作的低效。其他挑战包括基于遍历的查询的高计算需求,特别是在大规模网络中,以及在分布式图环境中管理事务的复杂性。此外,依赖传统的集中式架构也限制了在线事务处理(OLTP)的可扩展性,因竞争、CPU开销和网络带宽限制而产生瓶颈。 图数据库在处理跨多个领域的大规模数据集方面的日益重要性——例如医疗保健、工业、人工智能(AI)、生命科学、社交网络和软件工程——是本研究的动机。应对它们面临的挑战需要高效的查询语言和优化的存储解决方案,以提高其整体性能。

本文对图数据库进行了详细的调研。首先,分析了属性模型、查询语言和存储架构,概述了用户和开发者通常涉及的基础内容。接着,本文提供了图数据库技术最新进展的详细分析,评估了这些技术在架构、部署、使用和开发等关键方面的表现,这些方面共同定义了图数据库解决方案的能力。 我们对多个图数据库系统和调研进行了全面分析,以揭示该生态系统中的关键细节。同时,我们列出了多种特性,以帮助开发者和研究人员识别他们使用案例的具体需求以及适合的技术。 展望未来,随着数据量的不断增长,特别是在人工智能领域,图数据库有望继续发展。接下来的十年,预计将出现一些令人兴奋的趋势,主要表现在已有的商业公司及其优先关注的特性上。 关键词:图数据库;图查询语言;图存储架构;图模型与表示

图数据库在处理复杂且互联的数据方面变得愈加重要,这类数据广泛应用于社交网络、生命信息学、推荐系统等领域 [1, 2]。与传统的关系型数据库不同,图数据库为复杂和相互关联的数据提供了一个更直观的模型,使其特别适用于需要高效且灵活地建模和查询复杂关系的应用。 本研究的动机来源于图数据库在处理大规模数据方面的日益重要性,尤其是在多个领域中(如健康 [3]、工业 [4]、人工智能(AI) [5]、生命科学 [6]、社交网络 [7]、网络分析 [8] 和软件工程 [9])的各种使用案例,以及在这一背景下对高效查询语言和存储解决方案的需求。 在过去十年里,图数据库生态系统的复杂性不断增加,生态系统蓬勃发展,许多新的商业产品往往受益于社区的参与。选择适当的解决方案需要理解图存储、图表示、查询语言和系统架构方面的知识。这样的知识对于正确引导问题至关重要,能够帮助行业和学术界的技术决策者识别其使用案例。 性能和较低的处理成本固然重要,但数据本地控制的能力或高质量文档的提供同样重要。一个开源社区,其成员能够快速迭代想法并解决问题,可以减少技术采纳的障碍,并显著加速开发任务。本文旨在阐明这些以及其他方面,并观察不同图数据库系统是否以及如何考虑这些方面,这些系统是我们从生态系统中识别出来的一个详尽列表的一部分。

尽管图数据库的应用日益广泛,但仍然存在若干挑战。例如,图数据的非规则性,如其结构的稀疏性(例如,表现为邻接矩阵的概念)可能导致数据读写的低效。其他挑战包括基于遍历的查询的高成本,尤其是在大规模网络中,以及分布式图环境中事务处理相关的问题。此外,传统的集中式系统架构往往限制了图数据库中在线事务处理(OLTP)的可扩展性,带来了竞争可能性、CPU开销和网络带宽等方面的瓶颈。 本文提供了图数据库的全面调研,首先聚焦于属性模型、查询语言和存储架构,以框定用户和开发者通常需要处理的主要方面。接着,我们根据上述方面以及一些更广泛的维度(或领域)对图数据库的最新研究进行了深入分析,每个领域体现了图数据库解决方案架构、部署、使用和开发中的关键特性(或方面)。这些维度包括支持、许可、编程模型、操作系统、部署、数据表示、并发性、性能、安全性、可扩展性、容错性或集成等。本文的其余部分安排如下:第2节介绍了相关的图模型和查询语言,因为这些模型和语言在选择符合消费者使用案例和能力的图数据库时起着决定性作用。第3节描述并展示了在实际图数据库解决方案中应用的各种存储架构的优势,从非结构化到先进的架构都有涉及。接下来,我们在第4节介绍了每个调研的图数据库,开头是对每个图数据库进行评估的特性,并将其分类到相应的类别中。我们还分析和讨论了之前列出的图数据库及其能力。由于图数据库研究领域已经相当丰富,接下来的第5节我们推荐了相关工作,最后在第6节总结了我们的调研。

成为VIP会员查看完整内容
9

相关内容

图基础模型:全面综述
专知会员服务
23+阅读 · 5月22日
视觉自回归模型综述
专知会员服务
39+阅读 · 2024年11月15日
图提示学习最新综述
专知会员服务
20+阅读 · 2024年8月28日
知识图谱与大模型融合综述
专知会员服务
115+阅读 · 2024年6月30日
视觉提示学习综述
专知会员服务
54+阅读 · 2024年3月23日
结构保持图transformer综述
专知会员服务
41+阅读 · 2024年2月19日
大规模图神经网络研究综述
专知会员服务
83+阅读 · 2023年8月25日
小样本图像分类研究综述
专知会员服务
56+阅读 · 2023年1月27日
图嵌入模型综述
专知会员服务
90+阅读 · 2022年1月17日
专知会员服务
32+阅读 · 2020年5月20日
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
时空数据挖掘:综述
专知
31+阅读 · 2022年6月30日
注意力机制综述(中文版)
专知
23+阅读 · 2021年1月26日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Arxiv
169+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
A survey on deep hashing for image retrieval
Arxiv
15+阅读 · 2020年6月10日
A Survey on Edge Intelligence
Arxiv
52+阅读 · 2020年3月26日
VIP会员
相关主题
相关VIP内容
图基础模型:全面综述
专知会员服务
23+阅读 · 5月22日
视觉自回归模型综述
专知会员服务
39+阅读 · 2024年11月15日
图提示学习最新综述
专知会员服务
20+阅读 · 2024年8月28日
知识图谱与大模型融合综述
专知会员服务
115+阅读 · 2024年6月30日
视觉提示学习综述
专知会员服务
54+阅读 · 2024年3月23日
结构保持图transformer综述
专知会员服务
41+阅读 · 2024年2月19日
大规模图神经网络研究综述
专知会员服务
83+阅读 · 2023年8月25日
小样本图像分类研究综述
专知会员服务
56+阅读 · 2023年1月27日
图嵌入模型综述
专知会员服务
90+阅读 · 2022年1月17日
专知会员服务
32+阅读 · 2020年5月20日
相关资讯
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
时空数据挖掘:综述
专知
31+阅读 · 2022年6月30日
注意力机制综述(中文版)
专知
23+阅读 · 2021年1月26日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
相关论文
Arxiv
169+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
A survey on deep hashing for image retrieval
Arxiv
15+阅读 · 2020年6月10日
A Survey on Edge Intelligence
Arxiv
52+阅读 · 2020年3月26日
微信扫码咨询专知VIP会员