论文浅尝 | 利用指针生成网络的知识图谱自然语言生成 - 专知

会员服务 ·

0

论文浅尝 | 利用指针生成网络的知识图谱自然语言生成

2020 年 5 月 14 日 开放知识图谱

论文笔记整理：谭亦鸣，东南大学博士，研究方向为知识图谱问答。

来源：Neurocomputing 382: 174-187 (2020)

链接：https://www.sciencedirect.com/science/article/abs/pii/S0925231219316820?via%3Dihub

指针生成网络在自然语言生成任务上表现出不错的性能，本文主要介绍的是自动生成KG中entity的描述生成任务，目标是对于输入的（来自KG）的entity及其属性（属性可以分为多种类型的slot）生成对应的自然语言文本描述。为了更加准确的利用自然语言生成过程中的copy机制（何时以及在什么位置copy源语言的内容），作者提出了一种可适应的指针生成网络模型KG2TEXT，在Person与Animal（来自WikiData，由Wang et al.提出的一种用于KG描述生成的数据集）的实验结果表明，该模型的性能达到了目前最优。

动机

实体描述生成（或者说几乎所有的自然语言生成）普遍存在的一个问题是新词的生成（或者说OOV），目前普遍的做法是将这些无法翻译（转换）的词通过copy添加到目标生成文本中。但是在生成过程的什么时候（when）以及什么位置（where）融合copy信息，是目前存在的一个挑战（无法准确处理when和where可能造成信息的重复生成或丢失）。因此，作者提出了一种基于可适应指针生成网络的模型，利用可变的覆盖损失函数在生成自然语言描述时尽可能多的覆盖实体的“属性-值”对。此外，作者还提出了一种“监督注意力机制”用于引导模型在生成时的判断（生成或复制）。

模型框架

首先对指针生成网络做一个简单的说明，这是一种混合了传统seq2seq和pointnetwork的网络，下图对比了seq2seq原始模型(上)与指针生成网络(下)的框架差异（图片摘自论文“Get To The Point: Summarization with Pointer-Generator Networks”https://arxiv.org/pdf/1704.04368.pdf），相比原始seq2seq，后者利用PointerNetwork的copy能力得到一个扩充的单词表（增加了源语言中的词）从而得到一组新的生成词分布，通过Pgen权重决定当前输出是该生成还是复制。

KG2TEXT的整体模型框架如下图所示，与上面的框架相比，主要的差异表现在编码器部分增加了slot type attention（用于识别KG中entity属性的类型），position attention（用于处理KG中1对多的属性），attention distribution部分使用了可变覆盖损失函数，以及在生成最终分布的部分添加了Supervised attention。

以往提出的覆盖函数通过聚合过去每一步输入的attention结果（公式10），用于避免重复的copy，但是作者认为这种方式无法保证所有的values都被涵盖在生成文档中，因此作者提出了新的覆盖损失函数（公式11），确保每个value能且只能被复制一次。（其机制如下图所示）

其中，

为了判断生成词应该通过复制还是生成，作者引入了监督attention，如表3所示，在训练过程中，对于每一个训练集中的目标段落，作者添加了一个指示标记ychoose生成的词为1，复制的为0，监督attention 的损失通过二元交叉熵损失函数实现：

实验和结果

作者使用了Wang et al.提出的Person及Animal的数据集用于实体描述生成任务，统计信息如表4所示：

本文实验对照的两个baseline：原始Seq2Seq，带有slot类型与位置attention的指针生成网络

表5展示了对比的生成模型性能（评价指标为BLEU, ROUGE, CIDEr）：

图3展示了两个数据集上，各模型的召回率表现：

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

登录查看更多

2

相关内容

生成网络

【ICML2020-中科院】论文本生成中质量/多样性评价与分布拟合目标之间的关系

【ICML2020-中科院】论文本生成中质量/多样性评价与分布拟合目标之间的关系

专知会员服务

17+阅读 · 2020年7月6日

【ICML2020-浙江大学】对抗性互信息的文本生成

【ICML2020-浙江大学】对抗性互信息的文本生成

专知会员服务

44+阅读 · 2020年7月4日

【ICLR 2019】双曲注意力网络，Hyperbolic Attention Network

【ICLR 2019】双曲注意力网络，Hyperbolic Attention Network

专知会员服务

84+阅读 · 2020年6月21日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知会员服务

58+阅读 · 2020年5月26日

【IJCAI2020-CMU】结构注意力的神经抽象摘要

【IJCAI2020-CMU】结构注意力的神经抽象摘要

专知会员服务

22+阅读 · 2020年4月23日

【微软】利用知识图谱提高抽象摘要的事实正确性，Boosting Factual Correctness

专知会员服务

18+阅读 · 2020年3月23日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【WSDM2020论文-UIUC】基于多模态图边变分自编码的社交网络关系学（附pdf）

专知会员服务

17+阅读 · 2019年11月23日

知识图谱本体结构构建论文合集

知识图谱本体结构构建论文合集

专知会员服务

109+阅读 · 2019年10月9日

论文浅尝 | 利用问题生成提升知识图谱问答

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

论文浅尝 | 利用知识-意识阅读器改进的不完整知识图谱问答方法

论文浅尝 | 利用知识-意识阅读器改进的不完整知识图谱问答方法

开放知识图谱

14+阅读 · 2019年10月27日

论文浅尝 | 面向自动问题生成的跨语言训练

论文浅尝 | 面向自动问题生成的跨语言训练

开放知识图谱

8+阅读 · 2019年9月6日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别

论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别

开放知识图谱

6+阅读 · 2019年8月19日

论文浅尝 | 基于知识库的神经网络问题生成方法

论文浅尝 | 基于知识库的神经网络问题生成方法

开放知识图谱

19+阅读 · 2019年6月21日

论文浅尝 | 基于未知谓词与实体类型知识图谱的 Zero-Shot 问题生成

论文浅尝 | 基于未知谓词与实体类型知识图谱的 Zero-Shot 问题生成

开放知识图谱

19+阅读 · 2019年6月4日

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

PaperWeekly

14+阅读 · 2019年3月18日

论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

开放知识图谱

9+阅读 · 2019年1月26日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Text-to-Image Synthesis Based on Machine Generated Captions

Text-to-Image Synthesis Based on Machine Generated Captions

Arxiv

3+阅读 · 2019年10月9日

Low-Resource Response Generation with Template Prior

Arxiv

4+阅读 · 2019年9月26日

Symbolic Priors for RNN-based Semantic Parsing

Symbolic Priors for RNN-based Semantic Parsing

Arxiv

3+阅读 · 2018年9月20日

Bidirectional Attention for SQL Generation

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

Harvesting Paragraph-Level Question-Answer Pairs from Wikipedia

Arxiv

3+阅读 · 2018年5月15日

Variational Knowledge Graph Reasoning

Arxiv

15+阅读 · 2018年4月5日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日

VIP会员

相关主题

自然语言生成

知识图谱问答

注意力机制

相关VIP内容

【ICML2020-中科院】论文本生成中质量/多样性评价与分布拟合目标之间的关系

【ICML2020-中科院】论文本生成中质量/多样性评价与分布拟合目标之间的关系

专知会员服务

17+阅读 · 2020年7月6日

【ICML2020-浙江大学】对抗性互信息的文本生成

【ICML2020-浙江大学】对抗性互信息的文本生成

专知会员服务

44+阅读 · 2020年7月4日

【ICLR 2019】双曲注意力网络，Hyperbolic Attention Network

【ICLR 2019】双曲注意力网络，Hyperbolic Attention Network

专知会员服务

84+阅读 · 2020年6月21日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知会员服务

58+阅读 · 2020年5月26日

【IJCAI2020-CMU】结构注意力的神经抽象摘要

【IJCAI2020-CMU】结构注意力的神经抽象摘要

专知会员服务

22+阅读 · 2020年4月23日

【微软】利用知识图谱提高抽象摘要的事实正确性，Boosting Factual Correctness

专知会员服务

18+阅读 · 2020年3月23日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【WSDM2020论文-UIUC】基于多模态图边变分自编码的社交网络关系学（附pdf）

专知会员服务

17+阅读 · 2019年11月23日

知识图谱本体结构构建论文合集

知识图谱本体结构构建论文合集

专知会员服务

109+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《战场能源实战化最佳实践：大规模作战中的发电、储能与配电体系》美陆军最新报告

《大西洋决心行动及涉乌克兰美国政府活动报告》最新120页

战术边缘计算：加速军事情报周期革命

《现代环境不确定性下的多域作战：小国防御体系构建》

相关资讯

论文浅尝 | 利用问题生成提升知识图谱问答

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

论文浅尝 | 利用知识-意识阅读器改进的不完整知识图谱问答方法

论文浅尝 | 利用知识-意识阅读器改进的不完整知识图谱问答方法

开放知识图谱

14+阅读 · 2019年10月27日

论文浅尝 | 面向自动问题生成的跨语言训练

论文浅尝 | 面向自动问题生成的跨语言训练

开放知识图谱

8+阅读 · 2019年9月6日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别

论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别

开放知识图谱

6+阅读 · 2019年8月19日

论文浅尝 | 基于知识库的神经网络问题生成方法

论文浅尝 | 基于知识库的神经网络问题生成方法

开放知识图谱

19+阅读 · 2019年6月21日

论文浅尝 | 基于未知谓词与实体类型知识图谱的 Zero-Shot 问题生成

论文浅尝 | 基于未知谓词与实体类型知识图谱的 Zero-Shot 问题生成

开放知识图谱

19+阅读 · 2019年6月4日

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

PaperWeekly

14+阅读 · 2019年3月18日

论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

开放知识图谱

9+阅读 · 2019年1月26日

相关论文

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Text-to-Image Synthesis Based on Machine Generated Captions

Text-to-Image Synthesis Based on Machine Generated Captions

Arxiv

3+阅读 · 2019年10月9日

Low-Resource Response Generation with Template Prior

Arxiv

4+阅读 · 2019年9月26日

Symbolic Priors for RNN-based Semantic Parsing

Symbolic Priors for RNN-based Semantic Parsing

Arxiv

3+阅读 · 2018年9月20日

Bidirectional Attention for SQL Generation

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

Harvesting Paragraph-Level Question-Answer Pairs from Wikipedia

Arxiv

3+阅读 · 2018年5月15日

Variational Knowledge Graph Reasoning

Arxiv

15+阅读 · 2018年4月5日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日

大家都在搜

CMU博士论文

无人机集群

软件无线电

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员