项目名称: 复杂环境下机器学习的理论研究

项目编号: No.61503179

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 高尉

作者单位: 南京大学

项目金额: 22万元

中文摘要: 学习理论的研究对机器学习的发展有着重要的支撑和指导作用。经典学习理论通常研究数据独立同分布、样本单标记、数据可信度高、一般采用精度作为衡量学习性能的准则。随着机器学习不断向更多应用领域拓展,学习环境变得越来越复杂,如数据分布随时空而改变、样本标记多且相互关联、数据包含大量噪声、多种准则从不同角度衡量学习的性能。本项目关注于复杂环境下机器学习的理论研究,拟给出针对分布变化的学习方法泛化性理论分析;拟给出基于标记关系的学习方法泛化性理论分析;拟给出数据噪声的理论分析,在此基础上提出能容忍噪声的学习方法;拟给出面向多种性能准则一致性理论分析,在此基础上提出具有一致性的学习方法。本项目研究可望产生高水平论文4-6篇,申请专利1-2项,培养2-4名研究生。

中文关键词: 机器学习;学习理论;泛化性分析;一致性分析;样本复杂度分析

英文摘要: Learning theory plays an important and directive role in the development of machine learning. Conventional learning theory always considers the cases where data are drawn i.i.d. from a distribution; each example has a single label without noise; the accuracy is used to measure the performance of classifiers. As machine learning comes to wider real applications, the learning environment becomes more and more complex inevitably, e.g., the data distribution varies according to time and space; each instance often has many correlated labels; the data are full of noise; different criterions are used to measure the performance of classifiers from different views. This project focuses on the learning theory under such complex environment. Our goals are to 1)provide theoretical analysis for generalization of classifiers learned from varied distribution; 2)provide theoretical analysis for generalization of classifiers based on label correlation; 3)provide theoretical analysis for noisy data, and suggest noise-free learning algorithms; 4) provide theoretical analysis for consistency on multiple criterions, and suggest consistent learning algorithms. In this project, it is expected to publish 4-6 high-quality papers on important international journals, conferences and top native journals, apply 1-2 patents, and supervise 2-4 graduate students.

英文关键词: Mahine Learning;Learning Theory;Generalization;Consistency;Sample Complexity

成为VIP会员查看完整内容
14

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
机器学习中原型学习研究进展
专知会员服务
45+阅读 · 2022年1月18日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
专知会员服务
138+阅读 · 2021年8月12日
【经典书】机器学习统计学,476页pdf
专知会员服务
118+阅读 · 2021年7月19日
专知会员服务
69+阅读 · 2021年7月1日
【经典书】统计强化学习:现代机器学习方法,206页pdf
专知会员服务
76+阅读 · 2021年2月24日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
67+阅读 · 2019年10月18日
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
【经典书】数理统计学,142页pdf
专知
2+阅读 · 2021年3月25日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
周志华的《机器学习》西瓜书出全新视频课啦!
数据分析
16+阅读 · 2019年6月10日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
机器学习线性代数速查
机器学习研究会
18+阅读 · 2018年2月25日
贝叶斯机器学习前沿进展
机器学习研究会
20+阅读 · 2018年1月21日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
国家自然科学基金
39+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
9+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
13+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
11+阅读 · 2021年3月25日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
25+阅读 · 2018年8月19日
Arxiv
151+阅读 · 2017年8月1日
小贴士
相关VIP内容
机器学习中原型学习研究进展
专知会员服务
45+阅读 · 2022年1月18日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
专知会员服务
138+阅读 · 2021年8月12日
【经典书】机器学习统计学,476页pdf
专知会员服务
118+阅读 · 2021年7月19日
专知会员服务
69+阅读 · 2021年7月1日
【经典书】统计强化学习:现代机器学习方法,206页pdf
专知会员服务
76+阅读 · 2021年2月24日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
67+阅读 · 2019年10月18日
相关资讯
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
【经典书】数理统计学,142页pdf
专知
2+阅读 · 2021年3月25日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
周志华的《机器学习》西瓜书出全新视频课啦!
数据分析
16+阅读 · 2019年6月10日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
机器学习线性代数速查
机器学习研究会
18+阅读 · 2018年2月25日
贝叶斯机器学习前沿进展
机器学习研究会
20+阅读 · 2018年1月21日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
相关基金
国家自然科学基金
39+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
9+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
13+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
11+阅读 · 2021年3月25日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
25+阅读 · 2018年8月19日
Arxiv
151+阅读 · 2017年8月1日
微信扫码咨询专知VIP会员