Recent techniques for the task of short text clustering often rely on word embeddings as a transfer learning component. This paper shows that sentence vector representations from Transformers in conjunction with different clustering methods can be successfully applied to address the task. Furthermore, we demonstrate that the algorithm of enhancement of clustering via iterative classification can further improve initial clustering performance with different classifiers, including those based on pre-trained Transformer language models.


翻译:用于短期文本集群任务的最新技术往往依赖文字嵌入作为转移学习的组成部分。本文表明,可成功应用变换器的句子矢量表述以及不同的组群方法来完成这项任务。此外,我们还表明,通过迭代分类增强集群的算法可以进一步改善不同分类器的初步组合性能,包括以经过培训的变换器语言模型为基础的分类器。

0
下载
关闭预览

相关内容

【AAAI2021】对比聚类,Contrastive Clustering
专知会员服务
78+阅读 · 2021年1月30日
最新《Transformers模型》教程,64页ppt
专知会员服务
325+阅读 · 2020年11月26日
商业数据分析,39页ppt
专知会员服务
165+阅读 · 2020年6月2日
Transformer文本分类代码
专知会员服务
118+阅读 · 2020年2月3日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【推荐】MXNet深度情感分析实战
机器学习研究会
16+阅读 · 2017年10月4日
Arxiv
0+阅读 · 2021年3月24日
Arxiv
31+阅读 · 2020年9月21日
VIP会员
相关VIP内容
【AAAI2021】对比聚类,Contrastive Clustering
专知会员服务
78+阅读 · 2021年1月30日
最新《Transformers模型》教程,64页ppt
专知会员服务
325+阅读 · 2020年11月26日
商业数据分析,39页ppt
专知会员服务
165+阅读 · 2020年6月2日
Transformer文本分类代码
专知会员服务
118+阅读 · 2020年2月3日
相关资讯
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【推荐】MXNet深度情感分析实战
机器学习研究会
16+阅读 · 2017年10月4日
Top
微信扫码咨询专知VIP会员