VIP内容

中科院自动化所智能感知与计算研究中心张羽丰、吴书等人,受到图结构数据易于建立整体关联关系的启发,提出一种基于图神经网络的归纳式文本分类方法。不再以完全顺序化的方式学习文本内容,而是将文本构建为复杂关联的图结构进行学习,为上述问题提供了解决思路。相关成果发表于顶级国际会议ACL 2020。

该工作以单词为节点、单词间的共现关系为边,将每个文档构建为拥有自身结构的图,将文本分类任务转化为图分类任务。通过应用图神经网络模型,单词可聚合学习所有关联单词的表示,同时也可捕获中长距离的上下文关系。最后使用最大池化加平均池化的方法,将所有单词聚合为该文本的表示,进而得到其分类标签。

基于图神经网络的文本分类模型示意图

该模型在多个数据集中均取得最好性能,同时适用于归纳式学习,即当文本包含较多新词的时候,也能取得不错的效果。

该项研究在自然语言处理、信息组织和管理、内容信息过滤等领域都有着广泛的应用,例如舆情监测、新闻分类、垃圾邮件过滤、个性化推荐等,也为相关领域的问题提供了新的研究思路。

成为VIP会员查看完整内容
0
45

最新论文

Detecting sarcasm and verbal irony is critical for understanding people's actual sentiments and beliefs. Thus, the field of sarcasm analysis has become a popular research problem in natural language processing. As the community working on computational approaches for sarcasm detection is growing, it is imperative to conduct benchmarking studies to analyze the current state-of-the-art, facilitating progress in this area. We report on the shared task on sarcasm detection we conducted as a part of the 2nd Workshop on Figurative Language Processing (FigLang 2020) at ACL 2020.

0
0
下载
预览
Top