论文浅尝 | 利用知识-意识阅读器改进的不完整知识图谱问答方法

2019 年 10 月 27 日 开放知识图谱

论文笔记整理：谭亦鸣，东南大学博士生，研究方向为知识库问答。

来源：ACL2019

链接：https://www.aclweb.org/anthology/P19-1417/

本文提出了一种融合不完整知识图谱与文档集信息的end2end问答模型，旨在利用结构化的实体，边缘信息（来自问题对应的知识子图）帮助理解非结构化的文档信息（来自检索），从而获得融合的问答证据，用于答案的预测。在WebQSP数据集上的实验表明，本文模型对于完整度不同知识图谱均能在问答性能上带来提升。

作者用上面这个例子阐述不完整知识图谱问答任务的必要性。从图 1 中的真实示例可以看到，现有的知识图谱并不能覆盖完全的知识信息。因此对于部分问答场景，同时使用到图谱和文本是获取到更精准答案的策略之一。

方法

图 2 描述了本文提出的模型框架，主要由一个SubGraph Reader模型（提取知识图谱信息）及一个Knowledge-Aware TextReader（提取文本信息）模型组成。

其中，原始问题经由SubGraph Reader整合得到与问题最为相关的实体/关系将用于重构问题信息（query information），并输入到Knowledge-Aware TextReader帮助从文本中预测问题的答案。

框架细节描述如下：

SubGraphReader

该模型的设计思路在于利用图-注意力机制（Graph-Attention）收集关联实体e的邻居N_e知识。图-注意力主要考虑两个方面：

邻居关系是否与问题相关；
邻居实体是否是问题的主题实体；

模型的输出各实体的向量化表示，并利用实体的关联邻居编码知识。

因此这里需要解决的两个子问题分别为：

1. 问题-关系匹配

这里利用了一个共享的LSTM编码问题序列{w₁^q, w₂^q…, w_n^q}及tokenized形式的关系词{ w₁^r, w₂^r…, w_m^r},从而得到两者对应的隐状态h^q与h^r。在此基础上，使用一个注意力机制对关系进行编码，形式如下：

考虑到一个问题可能匹配多个关系，且一个关系可能只匹配问题的一部分，因此作者在这里提出使用关系去逐个匹配问题中每个词，而后融合得到整体的匹配分数，形式如下：

2. 对于主题实体邻居的特别关注

在上述问题-关系匹配的基础上，作者发现由主题实体衍生的另一个特征也非常有用，即当主题实体的邻居在问题中出现，那么其在知识图谱中对应的三元组相对于不包含主题实体的其他三元组应该与问题具备更高的相关性。

邻居(r_i, e_i)其注意力得分的计算形式为：

3. 邻居的信息传播

为了聚合图谱中关联三元组的知识，作者对于每个实体定义了其传播规则如下：

其中，e为预先计算的图谱embedding，W是一个可训练的矩阵，是一个激活函数，是一个协调参数，由一个线性门函数（linear gate function）计算得到，用于控制原始实体信息的保留程度，形式如下：

Knowledge-AwareText Reader

作者表示这个部分主要是基于现有的阅读理解模型(Chen et al. Reading wikipedia to answer opendomain questions, ACL 2017),改进部分在于对问题和文本均学习了更多的知识-意识表示。主要包括:

1. 潜在空间的查询重制

首先使用self-attention编码器编码原始问题向量h^q,得到一个独立的问题表示:

作者收集问题的主题实体知识描述为:

接着,利用一个门机制将两者聚合如下:

2. 知识-意识文本强化

对于文本,作者首先使用了一个双向LSTM获取token-level的特征,利用文本中的实体链接注释,以类似查询重制的方式将实体知识融合到上述特征中,不过这里作者采用了一个新的条件门函数用以明确问题的条件,这一方式帮助reader动态选择与问题更加相关的输入。

函数描述如下：

其中，表示文本的token，表示其对应的token特征，则为其对应的链接实体。则是来自SubGraph Reader的实体embedding

3. 文本阅读中的实体信息聚合

最后，将知识扩充后的信息作为BiLSTM的输入，并且使用输出的token-level隐状态计算注意力得分，形如：

而后，获得每个文档的表示，形如：

对于确定的实体e及包含该实体的文本D^e，通过以下方式简单的将信息聚合并平均：

最后，利用获取的各实体表示（来自知识库和文本），通过匹配问题向量和实体实现答案的预测：

实验

数据集

实验使用的数据集来自WebQSP数据集，为了模拟真实场景的，作者也使用了（Sun et al. Open domain question answering using early fusion of knowledge bases and text）的数据集进行测试。

Baseline方面使用Key-Value Memory Network作为参照，分别测试了基于图谱和图谱+文本的两个版本，以及GraftNet的多个版本（GN-KB, GN-LF, GN-EF）

实验结果

相关内容

知识图谱问答

关注 6

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

69+阅读 · 2020年7月3日

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

41+阅读 · 2020年7月1日

近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文

专知会员服务

84+阅读 · 2020年6月16日

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

专知会员服务

103+阅读 · 2020年6月9日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

190+阅读 · 2020年5月31日

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

专知会员服务

16+阅读 · 2020年5月4日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知会员服务

161+阅读 · 2020年3月11日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

103+阅读 · 2020年2月20日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

132+阅读 · 2020年2月13日

知识图谱本体结构构建论文合集

专知会员服务

102+阅读 · 2019年10月9日

论文浅尝 | 基于图匹配神经网络的跨语言知识图对齐 (ACL 2019)

开放知识图谱

15+阅读 · 2019年11月30日

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

51+阅读 · 2019年9月1日

论文浅尝 | 基于复杂查询图编码的知识库问答

开放知识图谱

17+阅读 · 2019年7月22日

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

PaperWeekly

26+阅读 · 2019年7月20日

论文浅尝 | 利用 KG Embedding 进行问题回答

开放知识图谱

21+阅读 · 2019年7月7日

论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

开放知识图谱

30+阅读 · 2019年7月5日

论文浅尝 | 基于知识库的神经网络问题生成方法

开放知识图谱

19+阅读 · 2019年6月21日

论文浅尝 | 基于未知谓词与实体类型知识图谱的 Zero-Shot 问题生成

开放知识图谱

19+阅读 · 2019年6月4日

论文浅尝 | 基于Universal Schema与Memory Network的知识+文本问答

开放知识图谱

11+阅读 · 2018年12月16日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Knowledge Graphs

Arxiv

99+阅读 · 2020年3月4日

Efficiently Embedding Dynamic Knowledge Graphs

Arxiv

14+阅读 · 2019年10月15日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

15+阅读 · 2019年9月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

MMKG: Multi-Modal Knowledge Graphs

Arxiv

30+阅读 · 2019年3月13日

TTMF: A Triple Trustworthiness Measurement Frame for Knowledge Graphs

Arxiv

8+阅读 · 2018年9月25日

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

Exploring Graph-structured Passage Representation for Multi-hop Reading Comprehension with Graph Neural Networks

Arxiv

6+阅读 · 2018年9月6日

The Web as a Knowledge-base for Answering Complex Questions

Arxiv

5+阅读 · 2018年3月18日

VIP会员