【论文解读】基于copy机制的端到端实体关系抽取模型

会员服务 ·

【论文解读】基于copy机制的端到端实体关系抽取模型

2020 年 7 月 20 日 深度学习自然语言处理

点击上方，选择星标或置顶，每天给你送干货！

阅读大概需要9分钟

跟随小博主，每天进步一丢丢

每日英文

Weep no more, no sigh, nor groan. Sorrow calls no time that's gone.

别哭泣，别叹息，别呻吟。悲伤唤不回流逝的时光。

Recommender：云不见

作者：Chevalier
学校：华南理工大学

方向：自然语言处理

知乎：https://www.zhihu.com/people/chen-feng-91-57

编辑：王萌 (深度学习自然语言处理公众号)

已获作者授权，禁止二次转载

一、Background

为了构建大规模结构化的知识库，目前有很多工作专注于从自然语言文本中抽取关系事实。关系事实通常用三元组表示：（实体1，关系，实体2），比如（Chicago，country，UnitedStates）。

目前为止，有很多方法专注于关系抽取或关系分类任务，该任务是识别两个预先给出的实体之间的关系。这类方法假设实体已经给定，忽略了实体的抽取。早期的实体关系抽取方法是pipeline的，即先进行NER，然后再进行RE。这种流水线的方法将两个任务独立开来，忽略了两个任务之间的相关性。紧接着，就有人提出联合抽取实体关系的方法。早期的联合方法依赖于特征工程和NLP工具。随着深度学习的兴起，后期的工作开始用CNN或RNN来联合抽取实体关系。比如Miwa、Gupta、Zhang等人将关系抽取任务建模为槽填充问题。Zheng等人将联合抽取问题转换为序列标注问题。

实体关系三元组在句中通常是比较复杂的，存在关系重叠现象，根据关系重叠度可以分为三种类型：Normal，EntityPairOverlap（EPO），SingleEntityOverlap（SEO）。如下图所示。

二、Motivation

之前的工作主要专注于抽取Normal类型的实体关系三元组，特别是17年ACL那篇(传送门)，将实体关系抽取问题转化为序列标注问题，完全忽略了关系重叠问题。因此，作者就提出了基于Seq2Seq拷贝机制的端到端模型，可以抽取任意类型的实体关系三元组。该模型主要由两部分组成：编码器和解码器。编码器将自然语言文本转换成定长的语义向量，解码器根据该语义向量生成三元组。具体细节见Model部分。

三、Model

本节我们将介绍基于copy机制的Seq2Seq模型，端到端地抽取多个实体关系三元组。该模型主要由两部分组成：编码器和解码器。编码器将自然语言文本转换成定长的语义向量，解码器根据该语义向量生成三元组。解码器根据数量不同可以分为OneDecoder和MultiDecoder。顾名思义，OneDecoder就是用一个解码器来生成所有三元组，而MultiDecoder就是由多个解码器组成，一个解码器生成一个三元组。

OneDecoder Model

OneDecoder模型的整个结构如图二所示。

登录查看更多

相关内容

三元组

关注 5

三元组是指形如（（x，y），z）的集合（这就是说，三元组是这样的偶，其第一个射影亦是一个偶），常简记为（x，y，z）。三元组是计算机专业的一门公共基础课程——数据结构里的概念。主要是用来存储稀疏矩阵的一种压缩方式，也叫三元组表。假设以顺序存储结构来表示三元组表（triple table），则得到稀疏矩阵的一种压缩存储方式，即三元组顺序表，简称三元组表。

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

专知会员服务

38+阅读 · 2020年9月5日

实体关系抽取方法研究综述

专知会员服务

178+阅读 · 2020年7月19日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

105+阅读 · 2020年2月20日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日