异常值检测是数据挖掘中数据准备的重要环节 ,也 是学界探讨和研究的内容 。目前主要有3种策略 : (1)统计法:对样本总体分布作出假设的基础上,构造如四分位点、标准差等统计量进行检测,主要适用于单属性值的情况。 (2)距离法:将两个样本视为维空间的两点,计算两点间的Minkowski,Chebyshev或Mahalanobis距离来度量,此方法 能够应用 于多元 数值 ,但 没有综合考虑总体分布的因素,导致 太依赖于参数的选择。 (3)分类法: 建立分类模 型判断数据类别,以认定其是否与总体偏 离 ,一般 需要有大量样本集 以训练分类模型,并且此方法判断的颗粒度较大,相对于精细的数据要求显得误判率较高。
PyGOD: Python 图数据异常检测开源工具库
图与推荐
5+阅读 · 2022年4月11日
数据出现波动不要慌,手把手教你搭建数据异常监控体系
人人都是产品经理
1+阅读 · 2021年12月20日
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
腾讯:机器学习构建通用的数据异常检测平台
全球人工智能
10+阅读 · 2018年5月1日
边缘计算应用:传感数据异常实时检测算法
计算机研究与发展
11+阅读 · 2018年4月10日
留给人类的时间不多了?现在不学机器学习更待何时!
量化投资与机器学习
2+阅读 · 2017年11月21日
留给人类的时间不多了?现在不学机器学习更待何时!
数据挖掘入门与实战
1+阅读 · 2017年11月17日
留给人类的时间不多了?现在不学机器学习更待何时!
算法与数据结构
1+阅读 · 2017年11月16日
从“猿”到“金刚”,机器学习让你在职业生涯超进化!
算法与数据结构
0+阅读 · 2017年7月30日
从“猿”到“金刚”,机器学习让你在职业生涯超进化!
数据挖掘入门与实战
0+阅读 · 2017年7月30日
参考链接
父主题
微信扫码咨询专知VIP会员