CVPR 2021 Oral | 室内动态场景中的相机重定位 - 专知VIP

会员服务 ·

2

相机重定位 · 场景建模 · 增强现实（AR） · 机器人导航 ·

2021 年 4 月 12 日

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

相机重定位研究在已知环境中根据 RGB-D 图像推算相机的位置姿态，是实现场景建模、增强现实、机器人导航等技术的基础。近年来，最先进的研究工作通常 (A) 先记忆和推测所观测到不同对象的位置；(B) 再通过这些对象位置的相对关系反算自身位姿。对于 (A)，被观测对象的位置信息通常表示为图像像素坐标和场景世界坐标之间的对应关系（2D/3D-3D correspondences），使用决策树、神经网络等机器学习模型实现；对于 (B)，通常表示为局部坐标系与世界坐标系之间的刚体变换，使用 Perspective-n-Point、orthogonal Procrustes 等非机器学习算法求解。

核心问题

现实环境中包含着多种多样的动态成分，造成场景日新月异的变化。这些动态变化给相机重定位带来了麻烦：一方面，动态变化引入噪声导致对应关系匹配失败；另一方面，匹配正确的对象可能由于位置变化导致相机位姿求解错误。由于动态变化难以预料、无法穷尽，所以不易使用监督学习的方法直接学习场景中的动态变化。即使应用 RANSAC 等鲁棒估计算法，也难以准确求解动态场景下的相机位姿。因此，动态变化场景中的相机重定位面临挑战。

本文方法

为解决上述问题，我们提出基于空间划分的神经路由算法 NeuralRouting。我们的直观见解是，场景中的动态变化通常表现为几何对象的三维位置改变。于是，我们从几何角度出发建模场景空间。

首先，我们将场景三维空间进行层次划分构建树形结构（space partition tree），树的每个节点对应场景中的一个区域。随着树的层次加深，场景区域划分由粗粒度走向细粒度。基于区域划分，我们使用神经网络学习图像像素在树中的路由（routing），从而记忆视觉对象在不同粒度场景空间中的位置。得益于空间划分，通过显式地设定错误路由（模拟三维位置改变），我们可以构造动态变化对象的标注，以此学习场景中的动态变化，将其作为一个额外的路由分类，称为离群节点（outlier）。如果一个像素属于静态区域，它将被路由到树的叶子节点，以该节点对应的场景区域作为预测结果；如果一个像素属于动态区域，它将被路由到离群节点，被视为噪声点拒绝进行区域预测。因此，图像中的每个像素如果不被拒绝，那么就会被映射到场景空间，从而建立了图像像素和场景空间之间鲁棒的对应关系。通过这些对应关系，我们使用基于 Kabsch 算法的 RANSAC 框架求解相机位姿。

成为VIP会员查看完整内容

16

相关内容

相机重定位

相机重定位

[CVPR 2021] 基于傅里叶轮廓嵌入的任意形状文本检测（有源码）

专知会员服务

18+阅读 · 2021年5月8日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

CVPR 2021｜无需干净图像的自监督图像降噪

专知会员服务

39+阅读 · 2021年3月29日

【UCLA】动态图表示学习，40页ppt，Dynamic Graph Representation Learning

【UCLA】动态图表示学习，40页ppt，Dynamic Graph Representation Learning

专知会员服务

70+阅读 · 2021年3月7日

基于深度学习的点云语义分割研究综述

专知会员服务

72+阅读 · 2021年1月16日

【博士论文】复杂场景中的人群行为解析及其应用

专知会员服务

45+阅读 · 2020年12月8日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

专知会员服务

29+阅读 · 2020年3月25日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

计算机视觉life

23+阅读 · 2019年9月5日

【泡泡点云时空-PCL源码解读】PCL中的点云配准方法

【泡泡点云时空-PCL源码解读】PCL中的点云配准方法

泡泡机器人SLAM

69+阅读 · 2019年6月16日

【泡泡图灵智库】VITAMIN-E:极密集特征点的视觉跟踪和建图（CVPR）

【泡泡图灵智库】VITAMIN-E:极密集特征点的视觉跟踪和建图（CVPR）

泡泡机器人SLAM

10+阅读 · 2019年6月14日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

泡泡机器人SLAM

9+阅读 · 2019年3月20日

【泡泡一分钟】基于3D激光雷达地图的立体相机定位

【泡泡一分钟】基于3D激光雷达地图的立体相机定位

泡泡机器人SLAM

4+阅读 · 2019年1月14日

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

泡泡机器人SLAM

7+阅读 · 2018年6月24日

【泡泡一分钟】基于在线多智能体姿态优化的协作大规模稠密三维重建

【泡泡一分钟】基于在线多智能体姿态优化的协作大规模稠密三维重建

泡泡机器人SLAM

7+阅读 · 2018年5月27日

【泡泡一分钟】动态环境下稳健的单目SLAM

【泡泡一分钟】动态环境下稳健的单目SLAM

泡泡机器人SLAM

13+阅读 · 2018年3月22日

Fast Minimum-norm Adversarial Attacks through Adaptive Norm Constraints

Fast Minimum-norm Adversarial Attacks through Adaptive Norm Constraints

Arxiv

0+阅读 · 2021年6月3日

Discriminative Reasoning for Document-level Relation Extraction

Arxiv

1+阅读 · 2021年6月3日

RAI-Net: Range-Adaptive LiDAR Point Cloud Frame Interpolation Network

RAI-Net: Range-Adaptive LiDAR Point Cloud Frame Interpolation Network

Arxiv

0+阅读 · 2021年6月1日

PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection

Arxiv

4+阅读 · 2020年12月21日

Robust Neural Routing Through Space Partitions for Camera Relocalization in Dynamic Indoor Environments

Arxiv

3+阅读 · 2020年12月8日

SwapText: Image Based Texts Transfer in Scenes

SwapText: Image Based Texts Transfer in Scenes

Arxiv

4+阅读 · 2020年3月18日

Attention Guided Graph Convolutional Networks for Relation Extraction

Arxiv

4+阅读 · 2019年10月11日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

Few-shot Object Detection via Feature Reweighting

Arxiv

7+阅读 · 2018年12月5日

Joint Monocular 3D Vehicle Detection and Tracking

Joint Monocular 3D Vehicle Detection and Tracking

Arxiv

8+阅读 · 2018年12月2日

VIP会员

相关主题

相机重定位

增强现实（AR）

机器人导航

相关VIP内容

[CVPR 2021] 基于傅里叶轮廓嵌入的任意形状文本检测（有源码）

专知会员服务

18+阅读 · 2021年5月8日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

CVPR 2021｜无需干净图像的自监督图像降噪

专知会员服务

39+阅读 · 2021年3月29日

【UCLA】动态图表示学习，40页ppt，Dynamic Graph Representation Learning

【UCLA】动态图表示学习，40页ppt，Dynamic Graph Representation Learning

专知会员服务

70+阅读 · 2021年3月7日

基于深度学习的点云语义分割研究综述

专知会员服务

72+阅读 · 2021年1月16日

【博士论文】复杂场景中的人群行为解析及其应用

专知会员服务

45+阅读 · 2020年12月8日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

专知会员服务

29+阅读 · 2020年3月25日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

计算机视觉life

23+阅读 · 2019年9月5日

【泡泡点云时空-PCL源码解读】PCL中的点云配准方法

【泡泡点云时空-PCL源码解读】PCL中的点云配准方法

泡泡机器人SLAM

69+阅读 · 2019年6月16日

【泡泡图灵智库】VITAMIN-E:极密集特征点的视觉跟踪和建图（CVPR）

【泡泡图灵智库】VITAMIN-E:极密集特征点的视觉跟踪和建图（CVPR）

泡泡机器人SLAM

10+阅读 · 2019年6月14日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

泡泡机器人SLAM

9+阅读 · 2019年3月20日

【泡泡一分钟】基于3D激光雷达地图的立体相机定位

【泡泡一分钟】基于3D激光雷达地图的立体相机定位

泡泡机器人SLAM

4+阅读 · 2019年1月14日

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

泡泡机器人SLAM

7+阅读 · 2018年6月24日

【泡泡一分钟】基于在线多智能体姿态优化的协作大规模稠密三维重建

【泡泡一分钟】基于在线多智能体姿态优化的协作大规模稠密三维重建

泡泡机器人SLAM

7+阅读 · 2018年5月27日

【泡泡一分钟】动态环境下稳健的单目SLAM

【泡泡一分钟】动态环境下稳健的单目SLAM

泡泡机器人SLAM

13+阅读 · 2018年3月22日

相关论文

Fast Minimum-norm Adversarial Attacks through Adaptive Norm Constraints

Fast Minimum-norm Adversarial Attacks through Adaptive Norm Constraints

Arxiv

0+阅读 · 2021年6月3日

Discriminative Reasoning for Document-level Relation Extraction

Arxiv

1+阅读 · 2021年6月3日

RAI-Net: Range-Adaptive LiDAR Point Cloud Frame Interpolation Network

RAI-Net: Range-Adaptive LiDAR Point Cloud Frame Interpolation Network

Arxiv

0+阅读 · 2021年6月1日

PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection

Arxiv

4+阅读 · 2020年12月21日

Robust Neural Routing Through Space Partitions for Camera Relocalization in Dynamic Indoor Environments

Arxiv

3+阅读 · 2020年12月8日

SwapText: Image Based Texts Transfer in Scenes

SwapText: Image Based Texts Transfer in Scenes

Arxiv

4+阅读 · 2020年3月18日

Attention Guided Graph Convolutional Networks for Relation Extraction

Arxiv

4+阅读 · 2019年10月11日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

Few-shot Object Detection via Feature Reweighting

Arxiv

7+阅读 · 2018年12月5日

Joint Monocular 3D Vehicle Detection and Tracking

Joint Monocular 3D Vehicle Detection and Tracking

Arxiv

8+阅读 · 2018年12月2日

微信扫码咨询专知VIP会员