项目名称: 方差正则化的分类模型选择方法研究

项目编号: No.61503228

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 王钰

作者单位: 山西大学

项目金额: 18万元

中文摘要: 在生物信息, 图像处理等领域中, 如何利用统计机器学习方法选择一个合适的模型是进行模式分类的前提和关键. 传统的机器学习中往往直接基于性能度量指标的估计本身进行模型的选择, 但是这样的方法显然没有考虑估计的波动性从而有可能选择到错误的模型. 特别地, 近年来统计显著性检验方法被引入通过对照两个分类模型性能的差异来选择一个更优模型, 检验的方法虽然添加了方差信息但它依赖于数据的分布假定且进行多个模型中的两两模型对照时计算开销非常大, 不适合直接用于多个模型的选择. 基于上述分析, 我们考虑提供一个广泛使用的交叉验证框架下的方差正则化分类模型选择方法. 本项目的研究主要包括: (1)提供性能度量指标的交叉验证估计的准确合适的方差估计;(2)基于现有的交叉验证分类模型选择方法和提出的方差估计构造融合正则化方差的分类模型选择方法;(3)理论和实验分析证明它的优越性和可行性.

中文关键词: 模型选择;方差;正则化;分类

英文摘要: In areas such as Bioinformatics and Image Processing, how to use statistical machine learning method to select a right model is the premise and key of pattern classification. In traditional machine learning, model selection is always directly performed based on the estimation of performance measure index. However, these methods obviously do not take into account the variance of the estimation, and thus a wrong model may be selected. In particular, statistical significance test is introduced to select a better model by comparing the difference of the performances of two classification models in recent years. Although the variance information is added to the test method, it relies on the assumption of data distribution. And the computational cost is very large when performing the comparisons between any two models in multiple models, which is not suitable for direct use in the selection of multiple models. Based on the above analysis, we give a method of classification model selection based on variance regularization in a widely used cross validation framework. This study includes that (1) the exact and right variance estimation of the cross validated estimation of performance measure index is provided; (2) method of classification model selection integrating regularized variance is constructed based on the existing method of classification model selection with cross validation and the proposed variance estimation; (3) the superiority and feasibility are proved by theoretical and experimental analysis.

英文关键词: Model selection;Variance;Regularization;Classification

成为VIP会员查看完整内容
1

相关内容

【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
25+阅读 · 2022年2月12日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
专知会员服务
9+阅读 · 2021年10月17日
专知会员服务
21+阅读 · 2021年7月31日
专知会员服务
26+阅读 · 2021年7月11日
专知会员服务
11+阅读 · 2021年7月4日
【KDD2020】最小方差采样用于图神经网络的快速训练
专知会员服务
27+阅读 · 2020年7月13日
专知会员服务
107+阅读 · 2020年5月21日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
主成分分析用于可视化(附链接)
大数据文摘
0+阅读 · 2022年3月14日
多任务学习漫谈:以损失之名
PaperWeekly
1+阅读 · 2022年1月26日
ICML 2021 | AlphaNet:基于α-散度的超网络训练方法
PaperWeekly
0+阅读 · 2021年12月28日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
一文读懂机器学习模型的选择与取舍
DBAplus社群
13+阅读 · 2019年8月25日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
变分自编码器VAE:一步到位的聚类方案
PaperWeekly
25+阅读 · 2018年9月18日
一文看懂常用特征工程方法
AI研习社
17+阅读 · 2018年5月2日
深度学习中的五大正则化方法和七大优化策略
全球人工智能
11+阅读 · 2017年12月25日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月18日
小贴士
相关VIP内容
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
25+阅读 · 2022年2月12日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
专知会员服务
9+阅读 · 2021年10月17日
专知会员服务
21+阅读 · 2021年7月31日
专知会员服务
26+阅读 · 2021年7月11日
专知会员服务
11+阅读 · 2021年7月4日
【KDD2020】最小方差采样用于图神经网络的快速训练
专知会员服务
27+阅读 · 2020年7月13日
专知会员服务
107+阅读 · 2020年5月21日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
相关资讯
主成分分析用于可视化(附链接)
大数据文摘
0+阅读 · 2022年3月14日
多任务学习漫谈:以损失之名
PaperWeekly
1+阅读 · 2022年1月26日
ICML 2021 | AlphaNet:基于α-散度的超网络训练方法
PaperWeekly
0+阅读 · 2021年12月28日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
一文读懂机器学习模型的选择与取舍
DBAplus社群
13+阅读 · 2019年8月25日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
变分自编码器VAE:一步到位的聚类方案
PaperWeekly
25+阅读 · 2018年9月18日
一文看懂常用特征工程方法
AI研习社
17+阅读 · 2018年5月2日
深度学习中的五大正则化方法和七大优化策略
全球人工智能
11+阅读 · 2017年12月25日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员