主题模型,顾名思义,就是对文字中隐含主题的一种建模方法。“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。   在这里,我们先定义一下主题究竟是什么。主题就是一个概念、一个方面。它表现为一系列相关的词语。比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“李彦宏”等词语就会以较高的频率出现,而如果涉及到“IBM”这个主题,那么“笔记本”等就会出现的很频繁。如果用数学来描述一下的话,主题就是词汇表上词语的条件概率分布 。与主题关系越密切的词语,它的条件概率越大,反之则越小。
全网最具有挑战的NLP训练营是什么样的?
PaperWeekly
2+阅读 · 2019年6月8日
手把手教你用 R 语言分析歌词
AI研习社
0+阅读 · 2018年3月19日
下载 | 479页《数据科学基础》教程
机器学习算法与Python学习
2+阅读 · 2018年12月25日
BERTopic:NLP主题模型的未来!
夕小瑶的卖萌屋
2+阅读 · 2022年7月8日
参考链接
子主题
微信扫码咨询专知VIP会员