识别文字成份中的插图语言 (Figurative Language in Recognizing Textual Entailment)

We introduce a collection of recognizing textual entailment (RTE) datasets focused on figurative language. We leverage five existing datasets annotated for a variety of figurative language -- simile, metaphor, and irony -- and frame them into over 12,500 RTE examples.We evaluate how well state-of-the-art models trained on popular RTE datasets capture different aspects of figurative language. Our results and analyses indicate that these models might not sufficiently capture figurative language, struggling to perform pragmatic inference and reasoning about world knowledge. Ultimately, our datasets provide a challenging testbed for evaluating RTE models.

翻译：我们引入了一套以比喻语言为重点的识别文本要求数据集(RTE)集。我们利用五套现有的附加注释的数据集,用于各种比喻语言 -- -- 硅语、隐喻语和讽刺语 -- -- 并将其设置为12 500多个RTE实例。我们评估了在流行的RTE数据集方面训练有素的最新模型如何很好地捕捉了比喻语言的不同方面。我们的结果和分析表明,这些模型可能无法充分捕捉比喻语言,难以对世界知识进行务实的推论和推理。最终,我们的数据集为评估RTE模型提供了具有挑战性的测试台。

相关内容

数据集

关注 88

数据集，又称为资料集、数据集合或资料集合，是一种由数据所组成的集合。
Data set（或dataset）是一个数据的集合，通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量，如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数，该数据集的数据可能包括一个或多个成员。

知识驱动的视觉知识学习，以VQA视觉问答为例，31页ppt

专知会员服务

36+阅读 · 2020年9月25日

史上最全！358篇机器学习&自然语言处理综述论文！都这儿了

专知会员服务

129+阅读 · 2020年7月18日

【视频描述综述论文】Video Description: A Survey of Methods, Datasets, and Evaluation Metrics

专知会员服务

65+阅读 · 2020年5月12日

因果图，Causal Graphs，52页ppt

专知会员服务

250+阅读 · 2020年4月19日