Autonomous vehicles operate in highly dynamic environments necessitating an accurate assessment of which aspects of a scene are moving and where they are moving to. A popular approach to 3D motion estimation -- termed scene flow -- is to employ 3D point cloud data from consecutive LiDAR scans, although such approaches have been limited by the small size of real-world, annotated LiDAR data. In this work, we introduce a new large scale benchmark for scene flow based on the Waymo Open Dataset. The dataset is $\sim$1,000$\times$ larger than previous real-world datasets in terms of the number of annotated frames and is derived from the corresponding tracked 3D objects. We demonstrate how previous works were bounded based on the amount of real LiDAR data available, suggesting that larger datasets are required to achieve state-of-the-art predictive performance. Furthermore, we show how previous heuristics for operating on point clouds such as artificial down-sampling heavily degrade performance, motivating a new class of models that are tractable on the full point cloud. To address this issue, we introduce the model architecture \modelname~that provides real time inference on the full point cloud. Finally, we demonstrate that this problem is amenable to techniques from semi-supervised learning by highlighting open problems for generalizing methods for predicting motion on unlabeled objects. We hope that this dataset may provide new opportunities for developing real world scene flow systems and motivate a new class of machine learning problems.


翻译:自动飞行器在高度动态的环境中运行,需要准确评估一个场景的哪些方面正在移动,以及它们正在向哪个方向移动。3D运动估计的流行方法 -- -- 称为场景流 -- -- 是使用连续的LIDAR扫描的三维点云数据,尽管这些方法受到现实世界规模小的限制,但这种方法受到附加说明的LIDAR数据的限制。在这项工作中,我们引入了基于Waymo Open Datas数据集的场景流动的新的大规模基准。数据集是比以往真实世界数据集大得多的1 000美元。从附加注释的框架数量和从相应的跟踪的 3D 对象中衍生出来的新的模型。我们展示了以往工作是如何根据真实的LIDAR数据数量来进行3DAR 的。我们展示了先前工作的界限,表明需要更大的数据集才能达到最新水平的预测性性性能。此外,我们展示了以前在点云层上操作的超值性能,例如人工下调严重退化性性性能,鼓励在全点云层上可移动的新类型的新模型。为了解决这个问题,我们引入模型流流动性流动的,我们展示了真实的机能模型,我们展示了真实的模型,从而展示了真实的周期性模型,从而展示了真实性地展示了整个的周期性能方法。

0
下载
关闭预览

相关内容

根据激光测量原理得到的点云,包括三维坐标(XYZ)和激光反射强度(Intensity)。 根据摄影测量原理得到的点云,包括三维坐标(XYZ)和颜色信息(RGB)。 结合激光测量和摄影测量原理得到点云,包括三维坐标(XYZ)、激光反射强度(Intensity)和颜色信息(RGB)。 在获取物体表面每个采样点的空间坐标后,得到的是一个点的集合,称之为“点云”(Point Cloud)
专知会员服务
42+阅读 · 2021年4月2日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
193+阅读 · 2020年10月3日
数据科学导论,54页ppt,Introduction to Data Science
专知会员服务
42+阅读 · 2020年7月27日
因果图,Causal Graphs,52页ppt
专知会员服务
250+阅读 · 2020年4月19日
Uber AI NeurIPS 2019《元学习meta-learning》教程,附92页PPT下载
专知会员服务
113+阅读 · 2019年12月13日
强化学习最新教程,17页pdf
专知会员服务
181+阅读 · 2019年10月11日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
已删除
将门创投
4+阅读 · 2017年12月5日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
Few-shot Scene-adaptive Anomaly Detection
Arxiv
8+阅读 · 2020年7月15日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
已删除
将门创投
4+阅读 · 2017年12月5日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
Top
微信扫码咨询专知VIP会员