在统计中,离群点是与其他观测值有显着差异的数据点。离群点可能是由于测量的可变性或可能指示实验错误; 后者有时会从数据集中排除。 离群值会在统计分析中引起严重的问题。离群值可以偶然出现在任何分布中,但它们通常表示测量误差或总体具有重尾分布。 在前一种情况下,人们希望丢弃它们或使用对异常值具有鲁棒性的统计数据,而在后一种情况下,它们表明分布具有较高的偏度,并且在使用假设正态分布的工具或直觉时应格外谨慎。 异常值的常见原因是两种分布的混合,这可能是两个不同的子种群,或者可能表示“正确的试验”与“测量误差”;这是通过混合模型建模的。

精品内容

没有数据了, 换个别的吧!
参考链接
微信扫码咨询专知VIP会员