情感分类是对带有感情色彩的主观性文本进行分析、推理的过程,即分析对说话人的态度,倾向正面,还是反面。它与传统的文本主题分类又不相同,传统主题分类是分析文本讨论的客观内容,而情感分类是要从文本中得到它是否支持某种观点的信息。

VIP内容

论文概述:方面级情感分类(ALSC)旨在识别句子中特定方面词的情感极性。ALSC是方面级情感分析中一个最实际的设定,因为它不需要昂贵的意见词标注信息,但同时它也丧失了对于情感分类结果的可解释性。为了解决这个问题,最近的工作通过微调预训练Transformer编码器来抽取以方面词为中心的依存树来定位意见词。然而,这样推导出来的意见词只能提供一种直观的线索,远远无法达到人类级别的可解释性。除此之外,预训练编码器倾向于内化方面词的内在属性,会造成情感偏见问题,从而影响模型的性能。

在本文中,我们提出了一种span-based反情感偏见的方面词表示学习框架(SARL)。首先,它首先利用方面词的先验情感进行对抗学习来消除方面词嵌入表示中的情感偏见。随后,它通过span-based依赖关系建模来将意见词和与其对应的经过蒸馏学习得到的候选意见词进行对齐,实现了无监督意见词抽取,并为ALSC提供可解释性。本文中提出的方法在5个数据集上实现了领先的性能,且具备无监督意见词抽取的能力,能够有效的解决方面级情感分类问题,并为分类结果提供可解释性。

https://www.zhuanzhi.ai/paper/a2d43b48bfd4443af58a4a801ad5b2c1

成为VIP会员查看完整内容
0
11

最新论文

Estimating the predictive uncertainty of pre-trained language models is important for increasing their trustworthiness in NLP. Although many previous works focus on quantifying prediction uncertainty, there is little work on explaining the uncertainty. This paper pushes a step further on explaining uncertain predictions of post-calibrated pre-trained language models. We adapt two perturbation-based post-hoc interpretation methods, Leave-one-out and Sampling Shapley, to identify words in inputs that cause the uncertainty in predictions. We test the proposed methods on BERT and RoBERTa with three tasks: sentiment classification, natural language inference, and paraphrase identification, in both in-domain and out-of-domain settings. Experiments show that both methods consistently capture words in inputs that cause prediction uncertainty.

0
0
下载
预览
参考链接
Top
微信扫码咨询专知VIP会员