项目名称: 基于概率的名词性属性距离度量研究

项目编号: No.61203287

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 自动化学科

项目作者: 李超群

作者单位: 中国地质大学(武汉)

项目金额: 24万元

中文摘要: 距离度量是基于距离的机器学习算法的核心所在,很多距离相关的算法都依靠一个好的距离函数获得成功。而名词性属性距离度量相比数值属性距离度量更加复杂。本项目针对基于概率的名词性属性距离度量问题展开研究。研究内容包括:1)以朴素贝叶斯模型的属性独立假设为出发点,理论分析属性独立假设对距离函数的影响;2)借助贝叶斯网络和决策树模型来表达属性之间的依赖关系,并把表达的属性依赖关系引入距离函数中,构造新的距离函数,使之在具有强依赖关系的数据上表现出更好的性能;3)研究贝叶斯网络和决策树模型的类概率估测能力,甚至提出新的类概率估测模型,并利用其来计算基于概率的距离函数中的类成员概率,提高相关距离函数的性能。项目首次利用贝叶斯网络和决策树模型来研究距离度量问题,不仅可以为基于概率的名词性属性距离度量新方法研究提供示例,还可以推动基于概率的距离函数的应用,具有非常重要的理论意义和应用价值。

中文关键词: 距离度量;名词性属性;属性独立假设;属性依赖关系;类概率估测

英文摘要: Distance metrics play a key role for distance-related learning algorithms, and many distance-related learning algorithms depend on a good distance metric to be successful.Compared with distance metrics for numerical attributes, distance metrics for nominal attributes are not relatively wellunderstood. In this project, we work on probability-based distance metrics for nominal attributes. Main research contents include: 1) We take from the attribute independence assumption in the na?ve Bayes model and discuss the influnce of attribute independence assumption to the performance of distance metrics; 2) We investigate the attribute dependence relationships in Bayesian networks and decision tree models, and express the attribute dependence relationships in distance metrics to propose new distance metrics which will show good performance on those datas which have strong dependence relationships between attributes. 3) We study the class probability estimation ability of Bayesian networks and decision tree models, even propose new class probability estimation models, and apply them to calculate the class membership probability on the probabillity-based distance metrics, consequently improve the performance of relevant distance metrics. In this project, we firstly apply Bayesian networks and decision tree models to the st

英文关键词: distance metrics;nominal attributes;attribute independence assumption;attribute dependence relationship;class probability estimation

成为VIP会员查看完整内容
0

相关内容

【博士论文】开放环境下的度量学习研究
专知会员服务
45+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
专知会员服务
21+阅读 · 2021年10月6日
专知会员服务
39+阅读 · 2021年8月12日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
28+阅读 · 2021年6月7日
【南京大学冯雯博士论文】新型深度学习模型的研究
专知会员服务
65+阅读 · 2020年12月5日
专知会员服务
128+阅读 · 2020年7月10日
漫谈统计学习:关于基础概念那些事
PaperWeekly
0+阅读 · 2022年4月15日
【NeurIPS'21】从典型相关分析到自监督图表示学习
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
最全综述:基于深度学习的三维重建算法
极市平台
12+阅读 · 2020年3月17日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月14日
小贴士
相关VIP内容
【博士论文】开放环境下的度量学习研究
专知会员服务
45+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
专知会员服务
21+阅读 · 2021年10月6日
专知会员服务
39+阅读 · 2021年8月12日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
28+阅读 · 2021年6月7日
【南京大学冯雯博士论文】新型深度学习模型的研究
专知会员服务
65+阅读 · 2020年12月5日
专知会员服务
128+阅读 · 2020年7月10日
相关资讯
漫谈统计学习:关于基础概念那些事
PaperWeekly
0+阅读 · 2022年4月15日
【NeurIPS'21】从典型相关分析到自监督图表示学习
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
最全综述:基于深度学习的三维重建算法
极市平台
12+阅读 · 2020年3月17日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员