Feature screening approaches are effective in selecting active features from data with ultrahigh dimensionality and increasing complexity; however, the majority of existing feature screening approaches are either restricted to a univariate response or rely on some distribution or model assumptions. In this article, we propose a novel sure independence screening approach based on the multivariate rank distance correlation (MrDc-SIS). The MrDc-SIS achieves multiple desirable properties such as being distribution-free, completely nonparametric, scale-free, robust for outliers or heavy tails, and sensitive for hidden structures. Moreover, the MrDc-SIS can be used to screen either univariate or multivariate responses and either one dimensional or multi-dimensional predictors. We establish the asymptotic sure screening consistency property of the MrDc-SIS under a mild condition by lifting previous assumptions about the finite moments. Simulation studies demonstrate that MrDc-SIS outperforms three other closely relevant approaches under various settings. We also apply the MrDc-SIS approach to a multi-omics ovarian carcinoma data downloaded from The Cancer Genome Atlas (TCGA).


翻译:特征筛选方法在从超高维度和日益复杂的数据中选择积极特征方面是有效的;然而,大多数现有特征筛选方法要么局限于单向反应,要么依赖某种分布或模型假设;在本条中,我们提议根据多变量级距离相关关系(MrDc-SIS)采取新的可靠独立筛选方法;MrDc-SIS具有多种可取的特性,如无分布、完全不对等、无尺度、无尺度、对外向或重尾巴保持稳健、对隐藏结构敏感;此外,Dc-SIS先生可以用来筛选单向或多变量反应以及单维或多维预测器;我们通过取消以前对有限时刻的假设,在较轻的条件下确定Dc-SIS先生的无症状可靠检查属性;模拟研究表明,Dc-SISI先生在各种环境下都比其他三种密切相关的方法高。我们还将Dc-SIS先生的方法应用于从癌症基因组Atlas(TCGA)下载的多组合卵巢癌数据。

0
下载
关闭预览

相关内容

专知会员服务
18+阅读 · 2021年6月15日
专知会员服务
41+阅读 · 2021年4月2日
专知会员服务
75+阅读 · 2021年3月16日
多源数据行人重识别研究综述
专知会员服务
38+阅读 · 2020年11月2日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
LibRec 精选:位置感知的长序列会话推荐
LibRec智能推荐
3+阅读 · 2019年5月17日
已删除
将门创投
7+阅读 · 2019年3月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Arxiv
0+阅读 · 2021年11月28日
Arxiv
9+阅读 · 2020年10月29日
VIP会员
相关VIP内容
专知会员服务
18+阅读 · 2021年6月15日
专知会员服务
41+阅读 · 2021年4月2日
专知会员服务
75+阅读 · 2021年3月16日
多源数据行人重识别研究综述
专知会员服务
38+阅读 · 2020年11月2日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
LibRec 精选:位置感知的长序列会话推荐
LibRec智能推荐
3+阅读 · 2019年5月17日
已删除
将门创投
7+阅读 · 2019年3月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Top
微信扫码咨询专知VIP会员