论文浅尝 | 动态知识图谱对齐

2021 年 12 月 13 日 开放知识图谱

论文笔记整理:谭亦鸣,东南大学博士生

来源:AAAI‘21

链接:https://ojs.aaai.org/index.php/AAAI/article/view/16585

概述

本文提出了一种动态图谱(KG)对齐方法,在“动态”(即图谱可能随时间更新)的设定下,作者认为该任务的难点在于实体embedding的更新,因为KG更新后拓扑结构也会随之变化,而实体embedding与图谱结构高度相关。所提方法DINGAL-系列的核心思路是将KG表示学习使用的GCN参数矩阵视作特征转换操作,从而减少转换和聚合过程间的耦合。在与现有的14个方法在DBP15K数据集上的对比结果表明,论文方法取得不错性能,且提升了对齐速度。

背景与动机

这篇论文定义的实体对齐任务目标是将不完整的KG之间通过建立链接,获得一个完整KG的过程(如图1)。作者表示,现有对齐方法普遍假定KG是静态的,而事实上KG应该是处于一个更新和发展的过程中。基于此,论文提出了一个扩展的对齐任务:动态图谱对齐。

贡献

作者总结其贡献如下:

1.定义了动态图谱对齐问题,并第一个展开研究2.提出了新的算法,DINGAL系列,包括DINGAL-B(静态对齐)和GINGAL-O以及GINGAL-U面向动态对齐3.实验对比现有14种对齐模型取得了性能超越,并且系列算法取得了更快的运行速度

方法

图2给出了本文算法的描述,B算法用最初KG得到embedding,O和U的主要区别在于O沿用了B算法预训练参数对图谱更新后受到影响的节点作表示学习。而U则使用了一个全新的锚链接来更新参数。

图3给出了传统GCN过程,一个聚合-再-转换的函数。节点首先聚合它的邻居特征,然后这些特征通过一个线性转换矩阵投影到隐空间。

在传统方式下随KG结构变化来动态更新图谱embedding要求变化最好只发生在受影响的一小部分节点上。解决方向在于切断图谱拓扑结构与GCN参数矩阵之间的耦合。

作者首先将节点嵌入矩阵通过线性转换投影到一个隐空间,然后基于L聚合邻居节点的特征。DINGAL-B的流程如图4所示,对于任一实体的输入特征X,首先进入一个拓扑不变mask门M(公式2),该公式表示Hadamard乘积,用于确定特征不同维度的重要性(类似注意力机制)。

接着mask门的输出被输入到一个GCN层(公式3)

同时这个GCN层输出和mask门的输出一同输入到highway门(公式4)

最终网络的输出为:

接着使用以下的公式来衡量两个节点的距离:

对于DINGAL-O,首先保留了B方法的所有参数,在动态更新中更新那些受到影响的实体embedding。单跳受影响实体被定义为新实体(新增实体)和老实体(增加删除边操作),不考虑删除的实体,因为它们不参与动态对齐。图5给出了一个受影响节点划定的例子。

在O方法中,受影响更新的实体embedding的获取方式如公式8:

La表示局部拉普拉斯矩阵,来自全局L矩阵,La的范围由受影响的一跳邻居的size决定。

实验

实验使用的数据集是DBP15K,包含三种语言对,覆盖15K预对齐实体。

静态实验还是沿用DBP15K的常规切分测试集

动态实验,作者随机将DBP15K里的对齐对切分为三个动态时间步。在对于开始时间t0,KG移除3000个对齐的实体对以及链接到它们的边。对于任何不属于ground-truth的实体,如果它由于时间的变化而成为一个孤立的实体,它就会被删除。在时间步t1,1500个对齐的对以及与其链接的孤立实体将在t0被添加到KG对,这将在时间步t1形成新的KG对。

数据集评价指标为Hits@1和Hits@10

主要实验结果如下:(表1消融分析,w/o highway门,mask门,以及单层网络的效果),从结果看起来highway门是性能提升的主要原因

表2和3是动态对齐实验结果

作者也给出了结果,论述实验时间效率上所提方法相比已有方法有明显效率提升。


 

OpenKG


OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。


登录查看更多
5

相关内容

ACL2022 | 基于强化学习的实体对齐
专知会员服务
33+阅读 · 2022年3月15日
【KDD2020】 鲁棒的跨语言知识图谱实体对齐
专知会员服务
25+阅读 · 2020年9月10日
最新《动态网络嵌入》综述论文,25页pdf
专知会员服务
133+阅读 · 2020年6月17日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
132+阅读 · 2020年2月13日
论文浅尝 | KGNLI: 知识图谱增强的自然语言推理模型
开放知识图谱
0+阅读 · 2022年1月28日
论文浅尝 | 面向开放域的无监督实体对齐
开放知识图谱
0+阅读 · 2021年8月24日
论文浅尝 | 可建模语义分层的知识图谱补全方法
开放知识图谱
30+阅读 · 2020年3月8日
论文浅尝 | 一种用于多关系问答的可解释推理网络
开放知识图谱
18+阅读 · 2019年5月21日
论文浅尝 | 基于开放世界的知识图谱补全
开放知识图谱
11+阅读 · 2018年7月3日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
29+阅读 · 2019年3月13日
Arxiv
28+阅读 · 2018年4月6日
VIP会员
相关VIP内容
ACL2022 | 基于强化学习的实体对齐
专知会员服务
33+阅读 · 2022年3月15日
【KDD2020】 鲁棒的跨语言知识图谱实体对齐
专知会员服务
25+阅读 · 2020年9月10日
最新《动态网络嵌入》综述论文,25页pdf
专知会员服务
133+阅读 · 2020年6月17日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
132+阅读 · 2020年2月13日
相关资讯
论文浅尝 | KGNLI: 知识图谱增强的自然语言推理模型
开放知识图谱
0+阅读 · 2022年1月28日
论文浅尝 | 面向开放域的无监督实体对齐
开放知识图谱
0+阅读 · 2021年8月24日
论文浅尝 | 可建模语义分层的知识图谱补全方法
开放知识图谱
30+阅读 · 2020年3月8日
论文浅尝 | 一种用于多关系问答的可解释推理网络
开放知识图谱
18+阅读 · 2019年5月21日
论文浅尝 | 基于开放世界的知识图谱补全
开放知识图谱
11+阅读 · 2018年7月3日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员