大数据时代,随着社交媒体的不断普及,在网络以及生活中,各类文本数据日益增长,采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容,在给定标准下,根据内容对文本进行分类,文本分类的场景应用十分广泛,如情感分析、话题分类和关系分类等。深度学习是机器学习中一种基于对数据进行表征学习的方法,在文本数据处理中表现出了较好的分类效果。中文文本与英文文本在形、音、象上都有着区别,着眼于中文文本分类的特别之处,对用于中文文本分类的深度学习方法进行分析与阐述,最终梳理出常用于中文文本分类的数据集。文本分类是指为文本指定预定义标签的过程, 是 许 多 自 然 语 言 处 理 NLP(NaturalLanguage Processing)应用程序中的一项重要任务,具有众 多的应用场景,例如情感分析[1]如图1所示;问答 系统[2,3]的基本流程如图2所示;对话行为分类[4]、 话题分类[5]等。 近年来,国内外的文本分类研究者在传统机器 学习和深度学习2个方向对文本分类问题做了许 多探索和研究。本文将简要介绍传统机器学习的 文本分类方法,详细阐述使用深度学习的文本分类 方法。

成为VIP会员查看完整内容
25

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
大语言模型视角下的智能规划方法综述
专知会员服务
135+阅读 · 2024年4月20日
《基于深度学习的视觉文档信息抽取》研究综述
专知会员服务
35+阅读 · 2024年2月3日
基于深度学习的实时语义分割综述
专知会员服务
32+阅读 · 2023年11月27日
专知会员服务
40+阅读 · 2021年5月18日
专知会员服务
56+阅读 · 2021年4月20日
基于深度学习的数据融合方法研究综述
专知
36+阅读 · 2020年12月10日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
实体关系抽取方法研究综述
专知
14+阅读 · 2020年7月19日
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
Arxiv
180+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
大语言模型视角下的智能规划方法综述
专知会员服务
135+阅读 · 2024年4月20日
《基于深度学习的视觉文档信息抽取》研究综述
专知会员服务
35+阅读 · 2024年2月3日
基于深度学习的实时语义分割综述
专知会员服务
32+阅读 · 2023年11月27日
专知会员服务
40+阅读 · 2021年5月18日
专知会员服务
56+阅读 · 2021年4月20日
相关资讯
基于深度学习的数据融合方法研究综述
专知
36+阅读 · 2020年12月10日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
实体关系抽取方法研究综述
专知
14+阅读 · 2020年7月19日
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
相关论文
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
Arxiv
180+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
微信扫码咨询专知VIP会员