【CVPR2022】基于序列对比学习的长视频帧方向动作表示 - 专知VIP

会员服务 ·

2

CVPR 2022 · 序列对比学习 · 动作表示 · 视频分析 · 论文 ·

2022 年 3 月 29 日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

以往关于动作表示学习的研究主要集中在设计各种结构来提取短视频片段的全局表示。相比之下，许多实际应用，如视频对齐，对学习长视频的密集表示有很强的需求。在本文中，我们引入了一种新的对比动作表示学习(CARL)框架，以一种自监督的方式学习基于帧的动作表示，特别是长视频。具体地说，我们介绍了一个简单而有效的视频编码器，它考虑了时空上下文来提取帧方向表示。受自监督学习的最新进展的启发，我们提出了一种新的序列对比损失(SCL)，应用于通过一系列时空数据增强获得的两个相关视图。SCL通过最小化两个增广视图的序列相似度与时间戳距离的先验高斯分布之间的KL散度来优化嵌入空间。在FineGym、PennAction和Pouring 数据集上的实验表明，我们的方法在下游细粒度动作分类方面的表现大大超过了以前的先进技术。令人惊讶的是，尽管没有对成对的视频进行训练，我们的方法在视频对齐和细粒度的帧检索任务中也表现出了出色的性能。代码和模型可以在https://github.com/minghchen/CARL_code上找到。

https://www.zhuanzhi.ai/paper/eed105f3942b2c53b026d1a1793f4be8

成为VIP会员查看完整内容

10

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR2022】基于密集学习的半监督目标检测

【CVPR2022】基于密集学习的半监督目标检测

专知会员服务

20+阅读 · 2022年4月19日

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

专知会员服务

16+阅读 · 2022年4月11日

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

专知会员服务

5+阅读 · 2022年3月19日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知会员服务

10+阅读 · 2022年3月6日

【AAAI2022】基于对比时空前置学习的视频自监督表示

【AAAI2022】基于对比时空前置学习的视频自监督表示

专知会员服务

20+阅读 · 2021年12月19日

【ICCV2021】通过动作外观对齐的元适应无监督的少样本动作识别

专知会员服务

13+阅读 · 2021年10月1日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知会员服务

20+阅读 · 2020年8月11日

【CVPR2022】端到端实时矢量边缘提取（E2EC）

【CVPR2022】端到端实时矢量边缘提取（E2EC）

专知

1+阅读 · 2022年4月14日

【CVPR2022】视频对比学习的概率表示

【CVPR2022】视频对比学习的概率表示

专知

1+阅读 · 2022年4月12日

100+篇「CVPR2022」最新论文抢先看！论文解读、代码、数据集等，看计算机视觉2022在研究什么？

100+篇「CVPR2022」最新论文抢先看！论文解读、代码、数据集等，看计算机视觉2022在研究什么？

专知

1+阅读 · 2022年3月7日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知

0+阅读 · 2022年3月6日

聚焦视频文本检索：一文概览视频文本检索任务最新研究进展

聚焦视频文本检索：一文概览视频文本检索任务最新研究进展

PaperWeekly

1+阅读 · 2022年1月5日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】群体协同学习在共显著目标检测中的应用

【CVPR2021】群体协同学习在共显著目标检测中的应用

专知

0+阅读 · 2021年4月6日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】细粒度多标签分类

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于知识迁移的跨领域人体动作识别

国家自然科学基金

5+阅读 · 2013年12月31日

深度相机下基于全局-局部协作模型的视觉目标跟踪研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于形状先验的遥感目标可信识别技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向智能视频监控的多目标检测与跟踪技术研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于谓词规划树的规划方法的研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于2D视频视觉关注度的3D重建方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于计算机视觉的鞘翅目储粮害虫检测与分类识别研究

国家自然科学基金

0+阅读 · 2008年12月31日

SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in Soccer Videos

SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in Soccer Videos

Arxiv

0+阅读 · 2022年4月20日

OutCast: Outdoor Single-image Relighting with Cast Shadows

Arxiv

0+阅读 · 2022年4月20日

A Survey of Video-based Action Quality Assessment

Arxiv

0+阅读 · 2022年4月20日

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

Arxiv

0+阅读 · 2022年4月18日

Deep Surrogate Assisted MAP-Elites for Automated Hearthstone Deckbuilding

Arxiv

0+阅读 · 2022年4月16日

Incremental Prompting: Episodic Memory Prompt for Lifelong Event Detection

Arxiv

0+阅读 · 2022年4月15日

Max-Margin Contrastive Learning

Max-Margin Contrastive Learning

Arxiv

18+阅读 · 2021年12月21日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection

Arxiv

20+阅读 · 2019年10月25日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

VIP会员

相关主题

序列对比学习

相关VIP内容

【CVPR2022】基于密集学习的半监督目标检测

【CVPR2022】基于密集学习的半监督目标检测

专知会员服务

20+阅读 · 2022年4月19日

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

专知会员服务

16+阅读 · 2022年4月11日

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

专知会员服务

5+阅读 · 2022年3月19日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知会员服务

10+阅读 · 2022年3月6日

【AAAI2022】基于对比时空前置学习的视频自监督表示

【AAAI2022】基于对比时空前置学习的视频自监督表示

专知会员服务

20+阅读 · 2021年12月19日

【ICCV2021】通过动作外观对齐的元适应无监督的少样本动作识别

专知会员服务

13+阅读 · 2021年10月1日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知会员服务

20+阅读 · 2020年8月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

【CVPR2022】端到端实时矢量边缘提取（E2EC）

【CVPR2022】端到端实时矢量边缘提取（E2EC）

专知

1+阅读 · 2022年4月14日

【CVPR2022】视频对比学习的概率表示

【CVPR2022】视频对比学习的概率表示

专知

1+阅读 · 2022年4月12日

100+篇「CVPR2022」最新论文抢先看！论文解读、代码、数据集等，看计算机视觉2022在研究什么？

100+篇「CVPR2022」最新论文抢先看！论文解读、代码、数据集等，看计算机视觉2022在研究什么？

专知

1+阅读 · 2022年3月7日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知

0+阅读 · 2022年3月6日

聚焦视频文本检索：一文概览视频文本检索任务最新研究进展

聚焦视频文本检索：一文概览视频文本检索任务最新研究进展

PaperWeekly

1+阅读 · 2022年1月5日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】群体协同学习在共显著目标检测中的应用

【CVPR2021】群体协同学习在共显著目标检测中的应用

专知

0+阅读 · 2021年4月6日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】细粒度多标签分类

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

相关基金

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于知识迁移的跨领域人体动作识别

国家自然科学基金

5+阅读 · 2013年12月31日

深度相机下基于全局-局部协作模型的视觉目标跟踪研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于形状先验的遥感目标可信识别技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向智能视频监控的多目标检测与跟踪技术研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于谓词规划树的规划方法的研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于2D视频视觉关注度的3D重建方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于计算机视觉的鞘翅目储粮害虫检测与分类识别研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in Soccer Videos

SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in Soccer Videos

Arxiv

0+阅读 · 2022年4月20日

OutCast: Outdoor Single-image Relighting with Cast Shadows

Arxiv

0+阅读 · 2022年4月20日

A Survey of Video-based Action Quality Assessment

Arxiv

0+阅读 · 2022年4月20日

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

Arxiv

0+阅读 · 2022年4月18日

Deep Surrogate Assisted MAP-Elites for Automated Hearthstone Deckbuilding

Arxiv

0+阅读 · 2022年4月16日

Incremental Prompting: Episodic Memory Prompt for Lifelong Event Detection

Arxiv

0+阅读 · 2022年4月15日

Max-Margin Contrastive Learning

Max-Margin Contrastive Learning

Arxiv

18+阅读 · 2021年12月21日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection

Arxiv

20+阅读 · 2019年10月25日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

微信扫码咨询专知VIP会员