论文浅尝 - ACL2021 | 探讨跨句事件联合抽取问题

会员服务 ·

论文浅尝 - ACL2021 | 探讨跨句事件联合抽取问题

2021 年 7 月 19 日 开放知识图谱

转载公众号 | 浙大KG

论文题目：MLBiNet: A Cross-Sentence Collective Event Detection Network

本文作者：娄东方、廖智霖、邓淑敏、张宁豫、陈华钧（浙江大学）

接收会议：ACL 2021

论文链接：https://arxiv.org/pdf/2105.09458.pdf

开源代码：https://github.com/zjunlp/DocED

欢迎转载，转载请注明出处

引言

跨句事件抽取旨在研究如何同时识别篇章内多个事件。我们提出多层双向网络MLBiNet（Multi-Layer Bidirectional Network）融合跨句语义和关联事件信息，从而增强内各事件提及的判别。首先，为建模句子内部事件关系，我们提出双向解码器用于同时捕捉前向和后向事件依赖；然后，我们利用信息聚合器汇总句子语义和事件提及信息；最后，通过迭代多个由双向解码器和信息聚合器构造的单元，并在每一层传递邻近句子的汇总信息，最终感知到整个文档的语义和事件提及信息。实验表明，跨句语义信息和事件依赖关系对事件抽取有效，我们的方法在ACE05数据集上取得最优表现。

一、前言

事件抽取包括事件触发词检测（识别事件触发词，并明确所触发事件的类型）和属性抽取（识别触发事件的属性，并标注各属性对应角色）两个子任务。例如，“He died in hospital”中“died”作为一个Die类型事件的触发词，该事件中，属性“He”的角色为Person, “hospital”的角色为Place. 本文主要探讨事件触发词检测任务中的跨句触发词联合抽取问题。

图1 ACE05样例

当下，事件触发词检测任务面临的挑战主要包括：（1）句子上下文表示及篇章级信息整合[1],[2]。候选触发词类型的判定一般需要结合上下文信息，包括关联实体信息（类型等）、其他候选触发词等。例如，图1中句子3中的“firing”可能是开枪（触发Attack事件）或离职（触发End_Position事件），Attack事件的确立需要融合句子2,4等的信息。（2）句内和句间事件关联性建模[1],[3]。句4包含事件触发词fight和death，ACE05数据集中超过40%触发词如此共现；类似句2、句3和句4中的连续关联事件同样普遍。因此，建模事件之间依赖对于同时抽取句子、跨句多事件尤为重要。

现有方法主要专注于句子级事件抽取，忽略了存在于其他句子中的信息。通过对事件抽取benchmark数据集ACE05的分析，我们得出如下结论。（1）可将事件触发词检测任务视为一个Seq2Seq任务，其中，source序列为文本篇章或句子，target序列是事件标签序列。对应基于RNN的encoder-decoder框架能有效处理该类问题，其中encoder建模丰富的上下文语义信息，decoder在解码过程中捕捉标签的依赖性。（2）对于当前句子，与之关联最密切的信息主要存在于邻近句子，相距较远的文本影响较小。

基于上述现象和结论，我们提出基于encoder-decoder框架的多层双向网络MLBiNet，尝试融合跨句语义和事件信息以提升事件触发词检测效果。

二、方法

模型包括四部分：语义编码器、双向解码器、信息整合层、多层双向打标器等。其中，语义编码层由BiLSTM和自注意力机制构成；双向解码层融合前向解码和后向解码，有助于捕捉双向事件依赖关系；信息整合层基于简单LSTM结构整合句子内部事件标签信息和语义信息；多层双向打标器则逐层传递邻近句子信息，最终捕捉更大邻域范围内的语义和事件信息，进而实现跨句事件联合抽取。

具体而言，双向解码器（给定输入文本，target序列的长度已知，它与输入文本等长）表达如下：

其中，编码器和解码器定义为

对于多层双向打标器，它的结构主要约束包括：（1）信息传递只发生在相邻句子间；（2）当前句子中的所有token可见跨句信息是相同的；（3）随着层数增加，较远距离的句子信息可被当前句子获取到；（4）每层的双向打标器都由一个双向解码器和一个信息整合层构成。对于第k层事件标签向量信息计算方法为：

其中， $\mathbf{I}$

表示邻近句子在上一层中整合得到的信息。最终事件标签向量 $\mathrm{y}_{\mathrm{t}}^{\mathrm{d}}=\sum_{\mathrm{k}=1}^{\mathrm{K}} \alpha^{\mathrm{k}-1} \mathrm{y}_{\mathrm{t}}^{\mathrm{k}}$

三、实验

我们在ACE05数据集上进行了试验，如下两个表所示，我们的方法在不同维度都能取得较好的效果。双向解码器有效，它在1层时较之于HBTNGMA更优；跨句信息整合有意义，多层网络下，我们的方法在单事件句子和多事件句子的抽取效果都得到提升。

模块剖析进一步了验证双向解码器和信息整合层的作用。具体而言，双向解码器较之于单向方法显著更优；层数增加情况下，不同解码机制下的效果都能得到提升；不同信息整合机制也能引起一定表现变动。

四、总结与展望

在本文中，我们提出了一种跨句事件触发词联合识别方法MLBiNet，它能同时实现篇章信息整合和跨句事件依赖建模，最终实验证明该方法能有效提升事件触发词识别效果。接下来，我们可尝试将该方法的推广到其他篇章级信息抽取任务（Docred, NER等），整合跨句语义信息，并建模标签关系。

[1] Collective event detection via a hierarchical and bias tagging networks with gated multi-level attention mechanisms. EMNLP2018

[2] Document embedding enhanced event detection with hierarchical and supervised attention. ACL2018

[3] Jointly multiple events extraction via attention-based graph information aggregation. EMNLP2018

[4] Event extraction via dynamic multi-pooling convolutional neural networks. ACL2015

[5] Edge-enhanced graph convolution networks for event detection with syntactic relation. EMNLP2020

[6] Meta-learning with dynamic-memory-based prototypical network for few-shot event detection. WSDM2020

[7] Event extraction as multi-turn question answering. EMNLP2020

[8] A joint neural model for information extraction with global features. ACL2020

[9] Exploiting the ground-truth: An adversarial imitation based knowledge distillation approach for event detection. AAAI2019

[10] Exploiting argument information to improve event detection via supervised attention mechanisms. ACL2017

[11] Graph convolutional networks with argument-aware pooling for event detection. AAAI2018

[12] Event detection with multi-order graph convolution and aggregated attention. EMNLP2019

[13] Ontoed: Low-resource event detection with ontology embedding. ACL2021

[14] Docred: A large-scale document-level relation extraction dataset. ACL2019

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

登录查看更多

相关内容

事件

关注 2

【EMNLP2021】span-based反情感偏见的方面词表示学习框架

专知会员服务

16+阅读 · 2021年9月25日

【ACL2021】基于隐含结构推理网络的事件因果关系识别

专知会员服务

52+阅读 · 2021年8月13日

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

ACL2021 | 探讨跨句事件联合抽取问题

专知会员服务

21+阅读 · 2021年7月19日

事件研究进展到哪？ACL2021这份《事件自然语言处理》教程必看！附269页ppt

专知会员服务

75+阅读 · 2021年7月13日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【AAAI2021】以事件为中心的自然语言理解，256页ppt

专知会员服务

74+阅读 · 2021年2月8日

近期必读的六篇 EMNLP 2020【知识图谱】相关论文和代码

专知会员服务

43+阅读 · 2020年11月10日

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

专知会员服务

13+阅读 · 2020年9月19日

论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解

开放知识图谱

2+阅读 · 2022年4月8日

论文浅尝 | 基于异质图交互模型进行篇章级事件抽取

开放知识图谱

0+阅读 · 2021年9月26日

【SCIR笔记】文档级事件抽取简述

深度学习自然语言处理

17+阅读 · 2020年7月30日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

论文浅尝 | Doc2EDAG：一种针对中文金融事件抽取的端到端文档级框架

开放知识图谱

35+阅读 · 2019年10月7日

赛尔原创 | EMNLP 2019 常识信息增强的事件表示学习

哈工大SCIR

28+阅读 · 2019年9月12日

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

35+阅读 · 2019年6月23日

论文浅尝 | 使用循环神经网络的联合事件抽取

开放知识图谱

25+阅读 · 2019年4月28日

论文浅尝 | 基于知识库的自然语言理解 03#

开放知识图谱

14+阅读 · 2019年2月26日

论文浅尝 | 基于知识库的类型实体和关系的联合抽取

开放知识图谱

35+阅读 · 2018年12月9日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于叙事模式分析的无监督新闻事件语义抽取研究

国家自然科学基金

0+阅读 · 2012年12月31日

网络舆情信息中事件篇章关系检测方法的研究

国家自然科学基金

1+阅读 · 2012年12月31日

词汇化句法分析若干关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于汉语话题的句际关系自动分析研究

国家自然科学基金

0+阅读 · 2012年12月31日

情感信息抽取的资源建设及关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

面向开放领域的自动关系抽取技术研究

国家自然科学基金

5+阅读 · 2008年12月31日

Compositional Semantics and Inference System for Temporal Order based on Japanese CCG

Arxiv

0+阅读 · 2022年4月20日

Mention Memory: incorporating textual knowledge into Transformers through entity mention attention

Arxiv

0+阅读 · 2022年4月19日

Ingredient Extraction from Text in the Recipe Domain

Arxiv

0+阅读 · 2022年4月18日

Chinese Idiom Paraphrasing

Arxiv

0+阅读 · 2022年4月15日

Stretching Sentence-pair NLI Models to Reason over Long Documents and Clusters

Arxiv

0+阅读 · 2022年4月15日

Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering

Arxiv

16+阅读 · 2019年12月16日

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Arxiv

11+阅读 · 2019年9月23日

Approaches for Enriching and Improving Textual Knowledge Bases

Arxiv

15+阅读 · 2018年4月20日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

17+阅读 · 2018年1月15日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员