【NeurIPS2023】多样化的时空感知用于视频域泛化 - 专知VIP

会员服务 ·

12

NeurIPS 2023 · 视频理解 ·

2023 年 10 月 30 日

【NeurIPS2023】多样化的时空感知用于视频域泛化

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

视频域泛化旨在通过在源域中训练来学习对未见目标域具有普适性的视频分类模型。视频域泛化的一个关键挑战是在识别目标视频时防御对从源域中提取的特定域线索的过度依赖。为此，我们提议感知视频中的多种时空线索，旨在除特定域线索外发现潜在的域不变线索。我们贡献了一个名为时空多样化网络（STDN）的新模型，它从视频数据的空间和时间维度提高了多样性。首先，我们的STDN提议通过空间分组发现单个帧内的各种类型的空间线索。然后，我们的STDN提议通过时空关系建模在多个时空尺度上明确地建模视频内容之间的时空依赖性。对三种不同类型的基准的大量实验证明了我们方法的有效性和多功能性。 https://arxiv.org/pdf/2310.17942.pdf

成为VIP会员查看完整内容

19

相关内容

NeurIPS 2023

【NeurIPS2023】基于因果结构的文本增强用于文本的分布外泛化

【NeurIPS2023】基于因果结构的文本增强用于文本的分布外泛化

专知会员服务

15+阅读 · 2023年10月20日

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

专知会员服务

16+阅读 · 2023年9月24日

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

专知会员服务

19+阅读 · 2022年12月5日

UTC: 用于视觉对话的任务间对比学习的统一Transformer

UTC: 用于视觉对话的任务间对比学习的统一Transformer

专知会员服务

13+阅读 · 2022年5月4日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

14+阅读 · 2021年11月14日

【NeurIPS2021】利用领域特定特征来增强领域泛化

专知会员服务

23+阅读 · 2021年10月20日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

14+阅读 · 2021年9月11日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

53+阅读 · 2021年3月31日

【IJCAI2020-Facebook】利用弱标记数据对声音进行大规模的视听学习

【IJCAI2020-Facebook】利用弱标记数据对声音进行大规模的视听学习

专知会员服务

17+阅读 · 2020年6月3日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

25+阅读 · 2020年5月25日

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

4+阅读 · 2023年4月11日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知

5+阅读 · 2023年4月8日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知

5+阅读 · 2023年4月6日

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

18+阅读 · 2022年12月11日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

11+阅读 · 2021年8月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

18+阅读 · 2020年6月28日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

29+阅读 · 2015年12月31日

快速射线追踪模型处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

4+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

4+阅读 · 2014年12月31日

网络的小世界结构及其上随机游动的混合时

国家自然科学基金

1+阅读 · 2014年12月31日

随机排队网络的强逼近及其相关渐近分析

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

133+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

72+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

141+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

327+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

89+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

38+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【NeurIPS2023】基于因果结构的文本增强用于文本的分布外泛化

【NeurIPS2023】基于因果结构的文本增强用于文本的分布外泛化

专知会员服务

15+阅读 · 2023年10月20日

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

专知会员服务

16+阅读 · 2023年9月24日

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

专知会员服务

19+阅读 · 2022年12月5日

UTC: 用于视觉对话的任务间对比学习的统一Transformer

UTC: 用于视觉对话的任务间对比学习的统一Transformer

专知会员服务

13+阅读 · 2022年5月4日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

14+阅读 · 2021年11月14日

【NeurIPS2021】利用领域特定特征来增强领域泛化

专知会员服务

23+阅读 · 2021年10月20日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

14+阅读 · 2021年9月11日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

53+阅读 · 2021年3月31日

【IJCAI2020-Facebook】利用弱标记数据对声音进行大规模的视听学习

【IJCAI2020-Facebook】利用弱标记数据对声音进行大规模的视听学习

专知会员服务

17+阅读 · 2020年6月3日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

25+阅读 · 2020年5月25日

热门VIP内容

相关资讯

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

4+阅读 · 2023年4月11日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知

5+阅读 · 2023年4月8日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知

5+阅读 · 2023年4月6日

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

18+阅读 · 2022年12月11日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

11+阅读 · 2021年8月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

18+阅读 · 2020年6月28日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

相关基金

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

29+阅读 · 2015年12月31日

快速射线追踪模型处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

4+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

4+阅读 · 2014年12月31日

网络的小世界结构及其上随机游动的混合时

国家自然科学基金

1+阅读 · 2014年12月31日

随机排队网络的强逼近及其相关渐近分析

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

133+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

72+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

141+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

327+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

89+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

38+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员