论文浅尝 | 常识用于回答生成式多跳问题

2018 年 11 月 24 日 开放知识图谱

链接：https://arxiv.org/pdf/1809.06309.pdf

AnsweringTasks

多跳问题一般需要模型可以推理、聚合、同步上下文中不同的信息。就需要理解那些人类通过背景知识可以理解的限制关系。本文提出了一个很强的baseline模型（multi-attention + pointer-generator decoder）；引入了一个评分函数评价从ConceptNet知识库中抽取多跳知识（pointwise mutual information + term-frequency ）；并有效的利用提取的常识信息填补上下文的推理中（ selectivelygated attentionmechanism）。

介绍

Machine Reading Comprehension: MRC 长期以来一直是评估模型理解和推理语言能力的任务。

Commonsense/Background Knowledge: 将常识知识作为外部数据库中的关系三元组或特征添加。

Incorporation of External Knowledge: 尝试使用外部知识来提高任务模型性能。

模型

Embedding Layer: ELMo(Peters et al., 2018)).

Reasoning Layer: context embedding 通过k个 resoning cell 模拟一步推理。每一步都通过query的 BiDAF attention(Seo et al., 2017)更新 context representation。

Self-Attention Layer: self-attention (Cheng et al., 2016) 解决 long-term dependencies and co-reference within the context.

Pointer-Generator Decoding Layer: (See et al.,2017) 生成答案。

引入常识

这部分是关键，主要分为两步：

a. 在常识知识库中找出多跳动候选路径, 形成树结构.

· C1是问句中的常识词.

· C2是C1通过一跳可以达到而且出现在 context 中. [Direct]

· C3是C2通过一跳可以到达而且出现在 context 中. [Multi-Hop]

· C4是C3的邻居,不必出现在 context. [OutsideKnowledge 获取更多信息]

· C5是C4的邻居,需要出现在 context中. [Context-Grounding. 确保信息有用]

b. 给候选路径打分筛选

· 节点初始分

1. C1\C2\C3重要的概念总是经常在上下文中出现，利用术语在上下文中的频率近似它概念的重要性.

|C|是上下文的长度\\count(c)是单词c出现的次数。

2. C4 不在上下文中，但在启发式的方法下，重要的概念经常在不同的路径里重复出现。

利用 Pointwise Mutual Information (PMI):

PMI(c4, c1−3) = log( P (c4, c1−3)/ P (c4) P(c1−3))

3. 不同分支、不同层级的节点不存在竞争，所以最后可以求一个标准化：

· 节点累计分

因为添加的常识信息包括多跳，所以计算评分的时候不止需要当前节点的得分，还要考虑其树的后代。

自底向上计算：其中f是这个节点得分最高的两个子节点平均得分。

c-score(c_l) =n-score(c_l) + f(c_l)

· 路径选择

· 自顶向下选择每个节点得分最高的两个。最多有2^4=16条路径。

实验

本文中在generative NarrativeQA (Kocisk ˇ y` et al., 2018) (summary subtask) 和 extractive QAngaroo WikiHop 这两个数据集上进行了实验，实验结果显示本文机制能够较大的提高模型的性能。

论文笔记整理：张晶尧，东南大学硕士生，研究方向为问答系统中复杂问题理解。

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

转载须知：转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题，请注明原标题。

点击阅读原文，进入 OpenKG 博客。

登录查看更多

相关内容

多跳

关注 0

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

69+阅读 · 2020年7月3日

近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文

专知会员服务

84+阅读 · 2020年6月16日

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

专知会员服务

103+阅读 · 2020年6月9日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

51+阅读 · 2020年5月5日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

103+阅读 · 2020年2月20日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

132+阅读 · 2020年2月13日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

168+阅读 · 2020年2月13日

BERT进展2019四篇必读论文

专知会员服务

65+阅读 · 2020年1月2日

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

专知会员服务

82+阅读 · 2019年12月14日

【综述】关键词生成，附10页pdf论文下载

专知会员服务

52+阅读 · 2019年11月20日

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

论文浅尝 | 通过文本到文本神经问题生成的机器理解

开放知识图谱

10+阅读 · 2019年6月30日

论文浅尝 | 基于未知谓词与实体类型知识图谱的 Zero-Shot 问题生成

开放知识图谱

19+阅读 · 2019年6月4日

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

论文浅尝 | 基于图注意力的常识对话生成

开放知识图谱

8+阅读 · 2019年2月5日

论文浅尝 | 在生成式多跳机器阅读任务中引入外部常识知识

开放知识图谱

10+阅读 · 2018年10月19日

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

开放知识图谱

13+阅读 · 2018年7月5日

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

开放知识图谱

25+阅读 · 2018年6月26日

论文浅尝 | 基于知识图的问答变分推理

开放知识图谱

6+阅读 · 2018年5月6日

论文浅尝 | 使用变分推理做KBQA

开放知识图谱

12+阅读 · 2018年4月15日

Adversarial Mutual Information for Text Generation

Arxiv

13+阅读 · 2020年6月30日

Attention Is (not) All You Need for Commonsense Reasoning

Arxiv

7+阅读 · 2019年5月31日

Music Transformer

Arxiv

5+阅读 · 2018年12月12日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

Commonsense for Generative Multi-Hop Question Answering Tasks

Arxiv

4+阅读 · 2018年9月17日

Learning Visual Question Answering by Bootstrapping Hard Attention

Arxiv

4+阅读 · 2018年8月1日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

3+阅读 · 2018年7月5日

Visual Question Answering with Memory-Augmented Networks

Arxiv

4+阅读 · 2018年3月25日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

Dual Recurrent Attention Units for Visual Question Answering

Arxiv

7+阅读 · 2018年2月1日

VIP会员