视频域泛化旨在通过在源域中训练来学习对未见目标域具有普适性的视频分类模型。视频域泛化的一个关键挑战是在识别目标视频时防御对从源域中提取的特定域线索的过度依赖。为此,我们提议感知视频中的多种时空线索,旨在除特定域线索外发现潜在的域不变线索。我们贡献了一个名为时空多样化网络(STDN)的新模型,它从视频数据的空间和时间维度提高了多样性。首先,我们的STDN提议通过空间分组发现单个帧内的各种类型的空间线索。然后,我们的STDN提议通过时空关系建模在多个时空尺度上明确地建模视频内容之间的时空依赖性。对三种不同类型的基准的大量实验证明了我们方法的有效性和多功能性。 https://arxiv.org/pdf/2310.17942.pdf

成为VIP会员查看完整内容
19

相关内容

【NeurIPS2023】PAXION:在视频-语言基础模型中修补动作知识
【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
13+阅读 · 2022年5月4日
【NeurIPS2021】用于视频分割的密集无监督学习
专知会员服务
14+阅读 · 2021年11月14日
专知会员服务
23+阅读 · 2021年10月20日
专知会员服务
14+阅读 · 2021年9月11日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
53+阅读 · 2021年3月31日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
【AAAI2023】用于图对比学习的谱特征增强
专知
18+阅读 · 2022年12月11日
【ICML2021】因果匹配领域泛化
专知
11+阅读 · 2021年8月12日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
【ICML2020】对比多视角表示学习
专知
18+阅读 · 2020年6月28日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
133+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
327+阅读 · 2023年3月31日
Arxiv
56+阅读 · 2023年3月26日
Arxiv
16+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【NeurIPS2023】PAXION:在视频-语言基础模型中修补动作知识
【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
13+阅读 · 2022年5月4日
【NeurIPS2021】用于视频分割的密集无监督学习
专知会员服务
14+阅读 · 2021年11月14日
专知会员服务
23+阅读 · 2021年10月20日
专知会员服务
14+阅读 · 2021年9月11日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
53+阅读 · 2021年3月31日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员