【泡泡点云时空】基于弱监督学习的3D形状补全方法(CVPR2018-10)

2018 年 8 月 24 日 泡泡机器人SLAM

泡泡点云时空，带你精读点云领域顶级会议文章

标题：Learning 3D Shape Completion from Laser Scan Data with Weak Supervision

作者：David Stutz, MPI for Intelligent Systems and University of Tubingen, Andreas Geiger, Computer Vision and Geometry Group, ETH Zurich

来源：CVPR2018 ( IEEE Conference on Computer Vision and Pattern Recognition)

编译：任乾

审核：郑英林

欢迎个人转发朋友圈；其他机构或自媒体如需转载，后台留言申请授权

摘要

利用局部点云进行3D形状补全是计算机视觉和计算机图形学中的基本问题。最近这方面的研究可以分为数据驱动的和基于学习的两大类。数据驱动的方法依赖于形状模型，需要根据观察结果去优化参数。相反，基于学习的方法可以避免复杂的优化步骤，而是使用深度神经网络直接从不完整的观测中去估计完整的形状。但是，他们都需要完全监督，这在实践中是很难满足的。在这里，我们提出了一种弱监督学习方法来补全3D形状，这种方法既不需要耗时的优化过程，也不需要直接监督。为了在不使用合成数据时学习形状，我们设计了基于深度神经网络的分阶段最大似然估计方法，可以在不损失精度的前提下高效地完成形状补全。基于ShapeNet和KITTI数据集的3D形状补全结果显示，我们提出的方法可以跟完全监督的方法，以及先进的数据驱动的方法相媲美，而且速度更快。在ModelNet数据集上的测试结果显示，该方法还能够适用于其他对象类别。

实现流程

图1 我们结合KITTI数据集上的例子来说明算法实现的流程。一共分两个步骤，第一步使用ShapeNet上的汽车模型训练自动编码机（VAE），汽车模型是在一个24 × 54 × 24体素的方格中使用占用栅格和有符号度量函数（SDFs）进行描述的。第二步对预训练的解码器进行重新训练，并同时训练一个固定编码器。该网络可以在不需要更多监督数据的情况下使用最大似然损失函数完成训练。预训练的解码器将预测约束为汽车的形状，而最大似然损失估计使预测结果与观测保持一致。

实现效果

图2 给定一个3D边界框和部分点云数据（图上左），实现了物体完整形状的预测（图上右）。在KITTI数据集上的3D补全结果见图下

Abstract

3D shape completion from partial point clouds is a fundamental problem in computer vision and computer graphics. Recent approaches can be characterized as either data driven or learning-based. Data-driven approaches rely on a shape model whose parameters are optimized to fit the observations. Learning-based approaches, in contrast, avoid the expensive optimization step and instead directly predict the complete shape from the incomplete observations using deep neural networks. However, full supervision is required which is often not available in practice. In this work, we propose a weakly-supervised learning-based approach to 3D shape completion which neither requires slow optimization nor direct supervision. While we also learn a shape prior on synthetic data, we amortize, i.e., learn, maximum likelihood fitting using deep neural networks resulting in efficient shape completion without sacrificing accuracy. Tackling 3D shape completion of cars on ShapeNet and KITTI, we demonstrate that the proposed amortized maximum likelihood approach is able to compete with a fully supervised baseline and a state-of-the-art data-driven approach while being significantly faster. On ModelNet, we additionally show that the approach is able to generalize to other object categories as well.

如果你对本文感兴趣，想要下载完整文章进行阅读，可以关注【泡泡机器人SLAM】公众号。

欢迎来到泡泡论坛，这里有大牛为你解答关于SLAM的任何疑惑。

有想问的问题，或者想刷帖回答问题，泡泡论坛欢迎你！

泡泡网站：www.paopaorobot.org

泡泡论坛：http://paopaorobot.org/forums/

泡泡机器人SLAM的原创内容均由泡泡机器人的成员花费大量心血制作而成，希望大家珍惜我们的劳动成果，转载请务必注明出自【泡泡机器人SLAM】微信公众号，否则侵权必究！同时，我们也欢迎各位转载到自己的朋友圈，让更多的人能进入到SLAM这个领域中，让我们共同为推进中国的SLAM事业而努力！

商业合作及转载请联系liufuqiang_robot@hotmail.com

登录查看更多

相关内容

弱监督学习

关注 7

弱监督学习：监督学习的一种。大致分3类，第一类是不完全监督（incomplete supervision），即，只有训练集的一个（通常很小的）子集是有标签的，其他数据则没有标签。这种情况发生在各类任务中。例如，在图像分类任务中，真值标签由人类标注者给出的。从互联网上获取巨量图片很容易，然而考虑到标记的人工成本，只有一个小子集的图像能够被标注。第二类是不确切监督（inexact supervision），即，图像只有粗粒度的标签。第三种是不准确的监督（inaccurate supervision），模型给出的标签不总是真值。出现这种情况的常见原因有，图片标注者不小心或比较疲倦，或者某些图片就是难以分类。

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日