Nowadays, data analysis has become a problem as the amount of data is constantly increasing. In order to overcome this problem in textual data, many models and methods are used in natural language processing. The topic modeling field is one of these methods. Topic modeling allows determining the semantic structure of a text document. Latent Dirichlet Allocation (LDA) is the most common method among topic modeling methods. In this article, the proposed n-stage LDA method, which can enable the LDA method to be used more effectively, is explained in detail. The positive effect of the method has been demonstrated by the applied English and Turkish studies. Since the method focuses on reducing the word count in the dictionary, it can be used language-independently. You can access the open-source code of the method and the example: https://github.com/anil1055/n-stage_LDA


翻译:目前,数据分析已成为一个问题,因为数据数量在不断增加。为了克服文字数据中的这个问题,自然语言处理中使用了许多模型和方法。主题建模领域是这种方法之一。主题建模可以确定文本文档的语义结构。LDA(LDA)是专题建模方法中最常见的方法。在本条中,详细解释了能够更有效地使用LDA方法的拟议n阶段LDA方法。该方法的积极效果已经通过应用的英语和土耳其语研究得到证明。由于该方法侧重于减少字典中的文字计数,因此可以独立使用语言。你可以访问该方法的开放源代码和实例:https://github.com/anil1055n-stage_LDA。您可以访问该方法的开放源代码,例如:https://github. com/anil1055n-stage_LDA。

0
下载
关闭预览

相关内容

专知会员服务
26+阅读 · 2021年7月17日
专知会员服务
90+阅读 · 2021年6月29日
专知会员服务
36+阅读 · 2021年6月16日
【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
五个精彩实用的自然语言处理资源
机器学习研究会
6+阅读 · 2018年2月23日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Topic Model Supervised by Understanding Map
Arxiv
0+阅读 · 2021年12月10日
VIP会员
相关VIP内容
专知会员服务
26+阅读 · 2021年7月17日
专知会员服务
90+阅读 · 2021年6月29日
专知会员服务
36+阅读 · 2021年6月16日
【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
相关资讯
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
五个精彩实用的自然语言处理资源
机器学习研究会
6+阅读 · 2018年2月23日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Top
微信扫码咨询专知VIP会员