这种新的高维小样本数据挖掘方法是否有用?

根据统计学习理论,在样本量确定的情况下,必须控制模型的复杂度以防止模型的学习结果“过拟合”,即“奥卡姆剃刀”原理,这就让我们为了控制模型的复杂度而无法…
关注者
92
被浏览
18,406
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

我感觉这种小样本小测试集非常不稳定。给你个方法:随机取样(train test),训练,预测,算score,这样一个流程重复多次,然后算score的std和mean,如果两个model的mean之差显著超过这两个model的std之和再考虑。而且要换不同函数测试稳定性。