【CVPR2021】CVPR2021 | MotionRNN：针对复杂时空运动的通用视频预测模型

本文介绍CVPR2021中稿论文：MotionRNN: A Flexible Model for Video Prediction with Spacetime-Varying Motions

论文链接：https://arxiv.org/abs/2103.02243

引言

视频预测方法被广泛应用于降水预报（Precipitation Nowcasting）、交通流预测（Traffic Flow Prediction）、机器人视觉规划（Visual Planning）等众多任务中。

然而现实世界的运动极其复杂，且往往处于不断变化中，比如人体运动中的变向、变速、肢体运动，雷达回波中的云团产生、消散、位移、形变等等。这种复杂的时空变化使得准确预测未来的运动极具挑战性。

针对复杂时空运动，我们关注到现实世界的运动在时空上可以分解为整体运动趋势（motion trend）与瞬时变化（transient variation），并基于此提出了名为MotionRNN的模型，对运动趋势与瞬时变化进行统一建模。

同时，作为一个通用的视频预测模型，MotionRNN具有很好的灵活性，可以结合众多的基于RNN的时空预测模型，稳定提升它们应对复杂时空运动的能力。

成为VIP会员查看完整内容

相关内容

视频预测

关注 1

【WWW2021】面向时空图预测的神经结构搜索

专知会员服务

23+阅读 · 2021年4月23日

【CVPR2021】通过上下文和运动解耦的自监督视频表示学习

专知会员服务

20+阅读 · 2021年4月15日

时空轨迹序列模式挖掘方法综述

专知会员服务

74+阅读 · 2021年4月8日

【CVPR2021】动态度量学习

专知会员服务

41+阅读 · 2021年3月30日

【CVPR2021】基于对比预测的缺失视图聚类方法

专知会员服务

22+阅读 · 2021年3月25日

复杂网络的双曲空间表征学习方法

专知会员服务

47+阅读 · 2020年11月13日

【ECCV2020诺亚】利用循环卷积网络与分频段处理的视频超分辨算法

专知会员服务

12+阅读 · 2020年9月2日

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

专知会员服务

17+阅读 · 2020年3月9日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

基于上下文信息分离的无监督运动目标检测（文末附有论文及源码下载）

计算机视觉战队

5+阅读 · 2019年7月4日

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

MSRA视觉组可变形卷积网络升级！更高性能，更强建模能力

未来产业促进会

6+阅读 · 2018年11月29日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

【泡泡一分钟】SfM-Net：从视频中学习结构和运动

泡泡机器人SLAM

9+阅读 · 2018年5月29日

【泡泡一分钟】基于场景流传播的动态街道场景的语义建图和目标检测

泡泡机器人SLAM

9+阅读 · 2018年4月29日

视频中的时序关系推理（解决静态帧行为识别问题）

极市平台

9+阅读 · 2018年1月4日

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

MoCoGAN 分解运动和内容的视频生成

CreateAMind

18+阅读 · 2017年10月21日

【技术分享】基于双流递归神经网络的人体骨架行为识别

机器学习研究会

5+阅读 · 2017年9月1日

Space-time Mixing Attention for Video Transformer

Arxiv

1+阅读 · 2021年6月11日

DeepVideoMVS: Multi-View Stereo on Video with Recurrent Spatio-Temporal Fusion

Arxiv

0+阅读 · 2021年6月10日

Making CNNs Interpretable by Building Dynamic Sequential Decision Forests with Top-down Hierarchy Learning

Arxiv

0+阅读 · 2021年6月5日

Generating the Cloud Motion Winds Field from Satellite Cloud Imagery Using Deep Learning Approach

Arxiv

0+阅读 · 2021年5月30日

Modeling Multi-Label Action Dependencies for Temporal Action Localization

Arxiv

0+阅读 · 2021年5月29日

TransCamP: Graph Transformer for 6-DoF Camera Pose Estimation

Arxiv

0+阅读 · 2021年5月28日

Graph Convolutional Networks for Temporal Action Localization

Arxiv

5+阅读 · 2019年9月7日

End-to-End Fine-Grained Action Segmentation and Recognition Using Conditional Random Field Models and Discriminative Sparse Coding

Arxiv

4+阅读 · 2018年1月29日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

9+阅读 · 2018年1月16日

Learning Hierarchical Features for Visual Object Tracking with Recursive Neural Networks

Arxiv

13+阅读 · 2018年1月6日

VIP会员