Tracking the 6D pose of objects in video sequences is important for robot manipulation. This work presents se(3)-TrackNet, a data-driven optimization approach for long term, 6D pose tracking. It aims to identify the optimal relative pose given the current RGB-D observation and a synthetic image conditioned on the previous best estimate and the object's model. The key contribution in this context is a novel neural network architecture, which appropriately disentangles the feature encoding to help reduce domain shift, and an effective 3D orientation representation via Lie Algebra. Consequently, even when the network is trained solely with synthetic data can work effectively over real images. Comprehensive experiments over multiple benchmarks show se(3)-TrackNet achieves consistently robust estimates and outperforms alternatives, even though they have been trained with real images. The approach runs in real time at 90.9Hz. Code, data and supplementary video for this project are available at https://github.com/wenbowen123/iros20-6d-pose-tracking


翻译:跟踪视频序列中天体的 6D 形状对于机器人操作很重要 。 这项工作展示了 se(3)- TrackNet, 这是一种数据驱动的长期优化方法, 6D 构成跟踪, 目的是根据当前 RGB- D 观测和合成图像, 以先前的最佳估计值和天体模型为条件, 确定最佳相对面貌 。 在这方面的关键贡献是一个新的神经网络结构, 它适当地分离了功能编码, 以帮助减少域变换, 并通过 lie Algebra 进行有效的 3D 定向 。 因此, 即使网络仅接受合成数据培训, 也能够有效地超越真实图像 。 多项基准的综合实验显示 se(3)- TrackNet 实现了持续稳健的估计数和优异的替代品, 尽管它们已经接受了真实图像培训 。 此方法实时运行在90.9Hz. 代码、 数据及该项目的补充视频可在 https://github.com/wenwen123/iros20-6d-stable- tracking 上查阅 。

0
下载
关闭预览

相关内容

专知会员服务
65+阅读 · 2021年5月21日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
21+阅读 · 2021年4月20日
专知会员服务
25+阅读 · 2021年3月7日
专知会员服务
109+阅读 · 2020年3月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【推荐】(TensorFlow)SSD实时手部检测与追踪(附代码)
机器学习研究会
11+阅读 · 2017年12月5日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
13+阅读 · 2021年3月29日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Single-frame Regularization for Temporally Stable CNNs
VIP会员
相关VIP内容
专知会员服务
65+阅读 · 2021年5月21日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
21+阅读 · 2021年4月20日
专知会员服务
25+阅读 · 2021年3月7日
专知会员服务
109+阅读 · 2020年3月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员