【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习 - 专知VIP

会员服务 ·

0

无监督学习 · 视频表示学习 ·

2021 年 2 月 12 日

【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

我们研究了无监督的视频表示学习，该学习旨在仅从未标记的视频中学习运动和外观特征，可以将其重用于下游任务，例如动作识别。然而，由于以下原因，这项任务极具挑战性：1）视频中的高度时空信息；2）缺少用于训练的标记数据。与静态图像的表示学习不同，难以构造合适的自我监督任务来很好地对运动和外观特征进行建模。最近，已经进行了几种尝试以通过视频回放速度预测来学习视频表示。但是，为视频获取精确的速度标签并非易事。更关键的是，学习的模型可能倾向于集中于运动模式，因此可能无法很好地学习外观特征。在本文中，我们观察到相对回放速度与运动模式更加一致，从而为表示学习提供了更加有效和稳定的监督。因此，我们提出了一种感知播放速度并利用两个视频片段之间的相对速度作为标签的新方法。这样，我们就能很好地感知速度并学习更好的运动功能。此外，为了确保学习外观特征，我们进一步提出了以外观为中心的任务，其中我们强制执行模型以感知两个视频剪辑之间的外观差异。我们表明，优化两个任务可以共同持续改善两个下游任务（即动作识别和视频检索）的性能。值得注意的是，对于UCF101数据集上的动作识别，在不使用标记数据进行预训练的情况下，我们达到了93.7％的准确性，这优于ImageNet监督的预训练模型。

https://arxiv.org/abs/2011.07949

成为VIP会员查看完整内容

19

相关内容

无监督学习

无监督学习

现实生活中常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。

【WWW2021】自监督多通道超图卷积网络

专知会员服务

40+阅读 · 2021年4月5日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

专知会员服务

15+阅读 · 2020年12月29日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【AAAI2021】自监督对应学习的对比转换

专知会员服务

20+阅读 · 2020年12月11日

【NeurIPS 2020】"鸡尾酒会"基于课程学习策略的自监督发声物体的判别性感知与定位

【NeurIPS 2020】"鸡尾酒会"基于课程学习策略的自监督发声物体的判别性感知与定位

专知会员服务

13+阅读 · 2020年11月3日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

专知会员服务

23+阅读 · 2020年4月9日

【AAAI2020-Oral】自监督时空学习的视频完形程序，Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning

【AAAI2020-Oral】自监督时空学习的视频完形程序，Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning

专知会员服务

30+阅读 · 2020年1月2日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

AI科技评论

9+阅读 · 2019年10月11日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

AI100

7+阅读 · 2019年5月7日

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

机器之心

6+阅读 · 2018年7月28日

通过视频着色进行自监督跟踪

通过视频着色进行自监督跟踪

谷歌开发者

3+阅读 · 2018年7月11日

让机器“一叶知秋”：弱监督视觉语义分割

让机器“一叶知秋”：弱监督视觉语义分割

深度学习大讲堂

6+阅读 · 2018年5月24日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

学界 | MIT与Facebook提出SLAC：用于动作分类和定位的稀疏标记数据集

学界 | MIT与Facebook提出SLAC：用于动作分类和定位的稀疏标记数据集

机器之心

4+阅读 · 2018年1月5日

Instance Localization for Self-supervised Detection Pretraining

Arxiv

0+阅读 · 2021年4月6日

Temporal Relational Modeling with Self-Supervision for Action Segmentation

Arxiv

13+阅读 · 2020年12月14日

Discriminative Sounding Objects Localization via Self-supervised Audiovisual Matching

Arxiv

6+阅读 · 2020年10月12日

Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation

Arxiv

6+阅读 · 2020年3月18日

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Arxiv

5+阅读 · 2019年9月26日

S$^\mathbf{4}$L: Self-Supervised Semi-Supervised Learning

Arxiv

5+阅读 · 2019年5月9日

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Arxiv

6+阅读 · 2019年2月26日

Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

Arxiv

4+阅读 · 2018年9月23日

Spatial-Temporal Memory Networks for Video Object Detection

Arxiv

4+阅读 · 2017年12月18日

Survival-Supervised Topic Modeling with Anchor Words: Characterizing Pancreatitis Outcomes

Arxiv

3+阅读 · 2017年12月7日

VIP会员

相关主题

无监督学习

视频表示学习

相关VIP内容

【WWW2021】自监督多通道超图卷积网络

专知会员服务

40+阅读 · 2021年4月5日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

专知会员服务

15+阅读 · 2020年12月29日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【AAAI2021】自监督对应学习的对比转换

专知会员服务

20+阅读 · 2020年12月11日

【NeurIPS 2020】"鸡尾酒会"基于课程学习策略的自监督发声物体的判别性感知与定位

【NeurIPS 2020】"鸡尾酒会"基于课程学习策略的自监督发声物体的判别性感知与定位

专知会员服务

13+阅读 · 2020年11月3日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

专知会员服务

23+阅读 · 2020年4月9日

【AAAI2020-Oral】自监督时空学习的视频完形程序，Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning

【AAAI2020-Oral】自监督时空学习的视频完形程序，Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning

专知会员服务

30+阅读 · 2020年1月2日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

AI科技评论

9+阅读 · 2019年10月11日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

AI100

7+阅读 · 2019年5月7日

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

机器之心

6+阅读 · 2018年7月28日

通过视频着色进行自监督跟踪

通过视频着色进行自监督跟踪

谷歌开发者

3+阅读 · 2018年7月11日

让机器“一叶知秋”：弱监督视觉语义分割

让机器“一叶知秋”：弱监督视觉语义分割

深度学习大讲堂

6+阅读 · 2018年5月24日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

学界 | MIT与Facebook提出SLAC：用于动作分类和定位的稀疏标记数据集

学界 | MIT与Facebook提出SLAC：用于动作分类和定位的稀疏标记数据集

机器之心

4+阅读 · 2018年1月5日

相关论文

Instance Localization for Self-supervised Detection Pretraining

Arxiv

0+阅读 · 2021年4月6日

Temporal Relational Modeling with Self-Supervision for Action Segmentation

Arxiv

13+阅读 · 2020年12月14日

Discriminative Sounding Objects Localization via Self-supervised Audiovisual Matching

Arxiv

6+阅读 · 2020年10月12日

Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation

Arxiv

6+阅读 · 2020年3月18日

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Arxiv

5+阅读 · 2019年9月26日

S$^\mathbf{4}$L: Self-Supervised Semi-Supervised Learning

Arxiv

5+阅读 · 2019年5月9日

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Arxiv

6+阅读 · 2019年2月26日

Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

Arxiv

4+阅读 · 2018年9月23日

Spatial-Temporal Memory Networks for Video Object Detection

Arxiv

4+阅读 · 2017年12月18日

Survival-Supervised Topic Modeling with Anchor Words: Characterizing Pancreatitis Outcomes

Arxiv

3+阅读 · 2017年12月7日

微信扫码咨询专知VIP会员