主题模型,顾名思义,就是对文字中隐含主题的一种建模方法。“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。   在这里,我们先定义一下主题究竟是什么。主题就是一个概念、一个方面。它表现为一系列相关的词语。比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“李彦宏”等词语就会以较高的频率出现,而如果涉及到“IBM”这个主题,那么“笔记本”等就会出现的很频繁。如果用数学来描述一下的话,主题就是词汇表上词语的条件概率分布 。与主题关系越密切的词语,它的条件概率越大,反之则越小。
  1. 主题模型(topic model)到底还有没有用,该怎么用? - 知乎
  2. Topic Modeling | Austin ACM SIGKDD
  3. Gensim: Topic Modelling For Humans - Tutorials
  4. PyGotham 2015. Introduction to Topic Modeling in Python
  5. PyTexas 2015. Topic Modeling in Python
  6. Graphviz - 话题精华 - 知乎
  7. 怎么确定LDA的topic个数? - 知乎
  8. University Of Michigan - Topic Modeling
  9. JVM中的线程模型是用户级的么? - 知乎
  10. MA模型的自变量到底是哪来的? - 知乎
  11. LDA...
  12. 为什么说结构方程模型是统计学革命? - 知乎
  13. 既然 LDA 是一种比 PLSA 更高级的模型,为啥百度还在用 PLSA
  14. 【量化模型】 Black-Litterman模型介绍
  15. 我需要farbox各类主题模板,有没有? - 知乎
  16. 将门创投 - 知乎
  17. 如何做纸模? - 知乎
  18. LDA主题模型,不是可以对文档直接分类?? - 知乎
  19. 女人觉得玩模型的男人很幼稚吗? - 知乎
  20. 在spark streaming中实时更新mllib的ALS...
展开全文
参考链接
子主题
微信扫码咨询专知VIP会员