NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

在开放世界中分类是验证模型安全性的重要方式，也是一个真正能够商用落地的模型不可避免要面对的问题。传统的分类模型都是在一个封闭的世界中进行训练，即假设测试数据和训练数据都来自同样的分布（称作分布内，in-distribution）。例如我们利用一组猫、狗照片训练一个猫、狗分类器。然而，部署的模型在实际使用中总是会遇到一些不属于封闭世界类别的图片，例如老虎。或者也会遇到一些和训练图片视觉上大相径庭的照片，例如卡通猫。模型应当如何去处理这些不属于训练分布的图片（即分布外样本，out-of-distribution），是开放世界领域所关注的问题。

开放世界领域中时常能够见到如下几个任务：

OD: Outlier Detection, 离群检测
AD: Anomaly Detection, 异常检测
ND: Novelty Detection, 新类检测
OSR: Open Set Recognition, 开集识别
OOD Detection: Out-of-Distribution Detection, 分布外检测

它们之间虽然各有千秋，却又有千丝万缕的联系。虽然现有工作也有尝试着将自己的任务和别的任务进行区分，但是各任务之间也不统一，使得整个领域都缺乏对各个任务准确的定义。让外界甚至参与者都对各个任务的具体目标困惑。

为了解决这个问题，一篇名为《Generalized Out-of-Distribution Detection: A Survey》的综述解决了这些困惑，将以上五个任务归纳进一个「广义 · 分布外检测」（Generalized OOD Detection）的大框架内。至此，这些任务都能进行准确的定位，而它们之间的关系也顿时清晰可辨。

论文地址： https://www.zhuanzhi.ai/paper/c934e74c6afb7fea3ed931c98877448f 项目主页：https://github.com/Jingkang50/OODSurvey

摘要：分布外检测(Out-of-distribution，OOD)是确保机器学习系统可靠性和安全性的关键。例如，在自动驾驶中，我们希望驾驶系统在检测到以前从未见过的不寻常场景或物体，无法做出安全决定时，发出警报，并将控制权交给人类。该问题最早出现于2017年，从那时起就越来越受到研究领域的关注，由此产生了大量的研究方法，从基于分类到基于密度再到基于距离的方法。同时，在动机和方法论方面，还有几个问题与OOD检测密切相关。这些方法包括异常检测(AD)、新奇检测(ND)、开放集识别(OSR)和异常点检测(OD)。尽管有不同的定义和问题设置，这些问题经常混淆读者和从业人员，因此，一些现有的研究误用术语。在本次综述中，我们首先提出了一个称为广义OOD检测的通用框架，它包含了前面提到的五个问题，即AD、ND、OSR、OOD检测和OD。在我们的框架下，这五个问题可以看作是特殊情况或子任务，更容易区分。然后，我们通过总结它们最近的技术发展，对这五个领域进行全面的调研。我们总结了这个调研查的开放挑战和潜在的研究方向。

成为VIP会员查看完整内容

相关内容

异常检测

关注 0

在数据挖掘中，异常检测（英语：anomaly detection）对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时，有趣性对象往往不是罕见对象，但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象，于是许多异常检测方法（特别是无监督的方法）将对此类数据失效，除非进行了合适的聚集。相反，聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。[1] 在假设数据集中大多数实例都是正常的前提下，无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集，并涉及到训练分类器（与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性）。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型，然后检测由学习模型生成的测试实例的可能性。

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

专知会员服务

58+阅读 · 2021年7月27日

【CMU博士论文】开放世界目标检测与跟踪，168页pdf

专知会员服务

60+阅读 · 2021年6月14日

《小样本元学习》2020最新综述论文

专知会员服务

173+阅读 · 2020年7月31日

【雪城大学】深度学习中的异常实例检测:综述论文，Anomalous Instance Detection