项目名称: 基于偏相关系数截断法的超高维模型的变量选择

项目编号: No.11401497

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 数理科学和化学

项目作者: 刘婧媛

作者单位: 厦门大学

项目金额: 22万元

中文摘要: 惩罚回归是在大数据模型中提取有用信息的办法之一。但对自变量个数随样本容量指数增长的超高维模型,我们通常需要一步额外的独立扫描步骤来降低模型维数。然而本项目旨在提出一种来源于不同理念框架的超高维变量选择方法——偏相关系数截断法。总体来说,此方法是基于偏相关系数体系以及部分忠实性理念的逐步检验法。它不仅可以处理超高维线性模型,也可以结合部分残差法扩展应用于超高维部分线性模型中。该方法将模型自变量和因变量的正态假设条件放宽为椭圆分布以适应真实数据通常面临的重尾性;它可以直接作用于超高维模型,无需进行传统的两步法;另外,为使本方法应用更加广泛,我们将从与传统方法不同的正则条件框架出发构造该方法的大样本性质,包括模型选择相合性、第一步检验的确定扫描性等。我们将利用模拟实验来比较偏相关系数截断法和传统的惩罚回归对于超高维模型的变量选择结果,并且将本方法应用于生物基因学领域和金融股票研究领域的数据分析。

中文关键词: 变量选择;线性及部分线性模型;偏相关系数;超高维数据;部分忠实性

英文摘要: The penalty-based variable selection technique is one of the appealing methods to identify significant variables in the high dimensional models. But for the ultrahigh dimensional models where the number of predictors increases exponentially with the samp

英文关键词: Variable selection;Linear and partially linear model;Partial correlation;Ultrahigh dimensional data;Partial faithfulness

成为VIP会员查看完整内容
1

相关内容

【新书稿】数据科学的谱方法:统计的视角,168页pdf
专知会员服务
54+阅读 · 2021年10月28日
【干货书】R语言探索性数据分析,218页pdf
专知会员服务
61+阅读 · 2021年9月14日
专知会员服务
47+阅读 · 2021年8月29日
专知会员服务
36+阅读 · 2021年6月6日
【经典书】数理统计学,142页pdf
专知会员服务
94+阅读 · 2021年3月25日
专知会员服务
140+阅读 · 2021年2月3日
一文读懂线性回归、岭回归和Lasso回归
CSDN
33+阅读 · 2019年10月13日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
数据分析师应该知道的16种回归方法:泊松回归
数萃大数据
34+阅读 · 2018年9月13日
数据分析师应该知道的16种回归技术:分位数回归
数萃大数据
29+阅读 · 2018年8月8日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
回归预测&时间序列预测
GBASE数据工程部数据团队
43+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Estimation of the Shapley value by ergodic sampling
Arxiv
0+阅读 · 2022年4月19日
Generalized Out-of-Distribution Detection: A Survey
Arxiv
15+阅读 · 2021年10月21日
Arxiv
38+阅读 · 2021年8月31日
小贴士
相关VIP内容
【新书稿】数据科学的谱方法:统计的视角,168页pdf
专知会员服务
54+阅读 · 2021年10月28日
【干货书】R语言探索性数据分析,218页pdf
专知会员服务
61+阅读 · 2021年9月14日
专知会员服务
47+阅读 · 2021年8月29日
专知会员服务
36+阅读 · 2021年6月6日
【经典书】数理统计学,142页pdf
专知会员服务
94+阅读 · 2021年3月25日
专知会员服务
140+阅读 · 2021年2月3日
相关资讯
一文读懂线性回归、岭回归和Lasso回归
CSDN
33+阅读 · 2019年10月13日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
数据分析师应该知道的16种回归方法:泊松回归
数萃大数据
34+阅读 · 2018年9月13日
数据分析师应该知道的16种回归技术:分位数回归
数萃大数据
29+阅读 · 2018年8月8日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
回归预测&时间序列预测
GBASE数据工程部数据团队
43+阅读 · 2017年5月17日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员