Event extraction has long been treated as a sentence-level task in the IE community. We argue that this setting does not match human information-seeking behavior and leads to incomplete and uninformative extraction results. We propose a document-level neural event argument extraction model by formulating the task as conditional generation following event templates. We also compile a new document-level event extraction benchmark dataset WikiEvents which includes complete event and coreference annotation. On the task of argument extraction, we achieve an absolute gain of 7.6% F1 and 5.7% F1 over the next best model on the RAMS and WikiEvents datasets respectively. On the more challenging task of informative argument extraction, which requires implicit coreference reasoning, we achieve a 9.3% F1 gain over the best baseline. To demonstrate the portability of our model, we also create the first end-to-end zero-shot event extraction framework and achieve 97% of fully supervised model's trigger extraction performance and 82% of the argument extraction performance given only access to 10 out of the 33 types on ACE.
翻译:在 IE 社群中, 事件提取长期以来一直被当作一个判决层面的任务 。 我们争辩说, 此设置与人类信息搜索行为不匹配, 并导致不完全和不知情的提取结果 。 我们提出一个文档层面神经事件参数提取模型, 以根据事件模板作为有条件生成的任务 。 我们还汇编了一个新的文件级事件基准数据集提取基准数据集 WikiEvents, 其中包括完整事件和共同引用注释 。 在论证提取任务中, 我们比 RAMS 和 WikiEvents 数据集的下一个最佳模型分别获得7. 6% F1 和 5.7% F1 的绝对收益。 关于信息性论证提取的更具挑战性的任务, 需要隐含的共同参照推理, 我们实现了9.3% F1 的收益超过最佳基线 。 为了展示我们的模型的可移植性, 我们还创建了第一个端到端零点事件提取框架, 并实现97% 完全监管的模型的触发性提取性能和82%的参数提取性能, 仅允许进入 ACE 33 类型中的 类型中的 。