今天的计算机视觉擅长于识别现实世界的限定部分:我们的模型似乎能在基准数据集中准确地检测出像猫、汽车或椅子这样的物体。然而,部署模型要求它们在开放世界中工作,开放世界包括各种设置中的任意对象。目前的方法在两个方面都有困难:他们只认识到少数的类别,并且在不同的训练分布的环境中切换。解决这些挑战的模型可以作为下游应用的基本构建模块,包括识别操作、操作对象和绕过障碍进行导航。本论文提出了我们在建立鲁棒检测和跟踪目标模型的工作,特别是有很少或甚至没有训练的样例。首先,我们将探索传统模型如何泛化到现实世界,传统模型只识别一小部分对象类。我们表明,目前的方法是极其敏感的:即使是输入图像或测试分布的细微变化,都可能导致精度下降。我们的系统评估显示,模型——即使是那些训练很好的对对抗或合成损坏具有鲁棒性的模型——经常正确地分类视频的一帧,但在相邻的感知相似的帧上却失败了。类似的现象甚至适用于由数据集之间的自然变化引起的微小分布变化。最后,我们提出了一种解决对象外观泛化的极端形式的方法:检测完全遮挡的对象。接下来,我们探索归纳到大的或无限的词汇,其中包含罕见的和从未见过的类。由于当前的数据集很大程度上局限于一个小的、封闭的对象集合,我们首先提出了一个大型词汇基准来衡量检测和跟踪的进展。我们展示了当前的评估不足以满足大型词汇量基准测试,并提供了适当评估此设置中的进度的替代指标。最后,我们提出了利用封闭世界识别的进展来为任何对象建立精确、通用的检测器和跟踪器的方法。

https://www.ri.cmu.edu/publications/open-world-object-detection-and-tracking/

成为VIP会员查看完整内容
58

相关内容

专知会员服务
103+阅读 · 2021年7月17日
自然语言处理现代方法,176页pdf
专知会员服务
263+阅读 · 2021年2月22日
【牛津大学博士论文】解释深度神经网络,134页pdf
专知会员服务
215+阅读 · 2020年10月8日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
84+阅读 · 2020年9月6日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
2018最具突破性计算机视觉论文Top 10
炼数成金订阅号
16+阅读 · 2019年2月15日
深度学习目标检测算法综述
AI研习社
24+阅读 · 2019年2月1日
CVPR 2018|Cascade R-CNN:向高精度目标检测器迈进
极市平台
10+阅读 · 2018年7月20日
论文 | 基于CNN的目标检测算法
七月在线实验室
9+阅读 · 2017年12月7日
斯坦福:「目标检测」深度学习全面指南
人工智能学家
8+阅读 · 2017年10月11日
Arxiv
8+阅读 · 2021年4月21日
Arxiv
7+阅读 · 2020年10月7日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
6+阅读 · 2018年1月29日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
专知会员服务
103+阅读 · 2021年7月17日
自然语言处理现代方法,176页pdf
专知会员服务
263+阅读 · 2021年2月22日
【牛津大学博士论文】解释深度神经网络,134页pdf
专知会员服务
215+阅读 · 2020年10月8日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
84+阅读 · 2020年9月6日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
相关资讯
2018最具突破性计算机视觉论文Top 10
炼数成金订阅号
16+阅读 · 2019年2月15日
深度学习目标检测算法综述
AI研习社
24+阅读 · 2019年2月1日
CVPR 2018|Cascade R-CNN:向高精度目标检测器迈进
极市平台
10+阅读 · 2018年7月20日
论文 | 基于CNN的目标检测算法
七月在线实验室
9+阅读 · 2017年12月7日
斯坦福:「目标检测」深度学习全面指南
人工智能学家
8+阅读 · 2017年10月11日
相关论文
Arxiv
8+阅读 · 2021年4月21日
Arxiv
7+阅读 · 2020年10月7日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
6+阅读 · 2018年1月29日
Arxiv
4+阅读 · 2016年12月29日
微信扫码咨询专知VIP会员