什么情况下需要将特征以及label转换为正态分布?

1.什么场景下需要进行转换?例如是不是回归问题可以做转换而分类问题不需要,线性模型需要做转换而树类模型不需要。 2.需要对哪部分数据做转换?是对lab…
关注者
12
被浏览
5,300
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

1.不同的模型有不同的要求。一般①线性回归模型需要对预测变量、噪声满足正态分布,②LDA 模型。

2.在线性回归模型中,特征和目标变量,特别是目标变量的正态化,能有效降低模型的RMSE或RMSLE值(换言之,更准确)。经验上,一般将偏态skew的绝对值大于0.75的特征和目标变量进行正态化处理(这部分可以使用取对数log、boxcox转换实现)。

3.线形回归的基本假设之一就是随机项服从或近似服从正态分布,进行正态性检验就是看看数据适合不适合做回归。另外,在深度学习模型中,正态化的数据也能一定程度上加快模型学习率。