视频理解 - 专知主题

会员服务 ·

视频理解

精品内容

【ICCV2025】《AdsQA：面向广告视频理解》

【ICCV2025】《AdsQA：面向广告视频理解》

专知会员服务

8+阅读 · 2025年9月11日

【CVPR2025】重新思考长时视频理解中的时序检索

【CVPR2025】重新思考长时视频理解中的时序检索

专知会员服务

13+阅读 · 2025年4月6日

【CUHK博士论文】构建高效且可扩展的视频理解AI模型

【CUHK博士论文】构建高效且可扩展的视频理解AI模型

专知会员服务

16+阅读 · 2025年1月25日

【NeurIPS2024】将视频掩蔽自编码器扩展到128帧

【NeurIPS2024】将视频掩蔽自编码器扩展到128帧

专知会员服务

13+阅读 · 2024年11月27日

【伯克利博士论文】揭示任何视频背后的四维世界

【伯克利博士论文】揭示任何视频背后的四维世界

专知会员服务

25+阅读 · 2024年11月24日

【伯克利博士论文】从自然场景视频中解耦人体运动和相机运动

【伯克利博士论文】从自然场景视频中解耦人体运动和相机运动

专知会员服务

18+阅读 · 2024年10月31日

【NUS博士论文】视频语义理解中的因果模型

【NUS博士论文】视频语义理解中的因果模型

专知会员服务

36+阅读 · 2024年10月30日

大模型如何做视频理解？最新《多模态大语言模型在全面长视频理解》综述

大模型如何做视频理解？最新《多模态大语言模型在全面长视频理解》综述

专知会员服务

30+阅读 · 2024年10月2日

《视频任意分割Segment Anything》系统性综述

《视频任意分割Segment Anything》系统性综述

专知会员服务

23+阅读 · 2024年8月19日

【新书】深度学习视频理解，194页pdf

【新书】深度学习视频理解，194页pdf

专知会员服务

55+阅读 · 2024年8月9日

基础模型视频理解综述

基础模型视频理解综述

专知会员服务

31+阅读 · 2024年5月8日

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

专知会员服务

21+阅读 · 2024年4月9日

【CVPR2024】VidLA: 大规模视频-语言对齐

【CVPR2024】VidLA: 大规模视频-语言对齐

专知会员服务

20+阅读 · 2024年3月31日

【CVPR2024】OmniViD: 一个用于通用视频理解的生成框架

【CVPR2024】OmniViD: 一个用于通用视频理解的生成框架

专知会员服务

25+阅读 · 2024年3月27日

《大型语言模型视频理解》综述

《大型语言模型视频理解》综述

专知会员服务

59+阅读 · 2024年1月2日

参考链接

微信扫码咨询专知VIP会员