【ICCV2025教程】《迈向视觉语言模型的全面推理》 - 专知VIP

会员服务 ·

11

ICCV 2025 · 视觉语言模型 · 图像描述 ·

【ICCV2025教程】《迈向视觉语言模型的全面推理》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

计算机视觉顶会ICCV 2025于10月19日至25日在美国夏威夷举行，今年论文投稿数11239篇，录用 2701篇，录用率为 24%，首次突破1w+的投稿量。Orals : 64篇（在总稿中占比0.6%，在录用稿中占比2.4%）、Highlights : 263篇、Posters 2374篇。

视觉语言模型（Vision-Language Models, VLMs）在图像描述（image captioning）和视觉问答（visual question answering）等任务中取得了显著进展，但如何发展出真正的推理能力仍然是一个尚未解决的开放性挑战。与近年来在推理导向的大语言模型（reasoning-focused LLMs）中取得的突破不同，许多现有的 VLM 仍主要依赖于模式识别，对组合逻辑（compositional logic）的处理能力不足。本教程将系统综述视觉语言模型的推理能力，重点探讨从基础感知到复杂推理的演化过程。内容涵盖多模态语境下的推理导向提示与训练方法、推理能力评估基准，以及视觉—文本融合的结构创新。通过讲座与实践演示相结合的形式，参与者将深入理解当前视觉语言模型的推理能力现状、在组合泛化与可解释性方面的持续挑战，并获得关于推理机制实现的实用指导。本教程的独特之处在于，它将大语言模型推理领域的最新进展延伸至视觉领域，聚焦空间信息处理的独特挑战，并为构建具备更高认知能力的视觉语言系统提供系统化的研究路线图。目录内容：

成为VIP会员查看完整内容

17

相关内容

ICCV 2025

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

专知会员服务

12+阅读 · 11月1日

CVPR2025开会了！《视觉基础模型》最新进展教程

CVPR2025开会了！《视觉基础模型》最新进展教程

专知会员服务

17+阅读 · 6月13日

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

专知会员服务

59+阅读 · 2024年3月2日

【AAAI2024教程】大模型知识编辑，192页ppt

【AAAI2024教程】大模型知识编辑，192页ppt

专知会员服务

82+阅读 · 2024年2月29日

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

专知会员服务

31+阅读 · 2024年2月28日

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

专知会员服务

54+阅读 · 2024年2月25日

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

专知会员服务

94+阅读 · 2024年2月21日

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

专知会员服务

82+阅读 · 2023年2月15日

【AAAI2023教程】大规模深度学习优化技术，109页ppt

【AAAI2023教程】大规模深度学习优化技术，109页ppt

专知会员服务

63+阅读 · 2023年2月10日

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

专知会员服务

60+阅读 · 2023年2月9日

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

PaperWeekly

19+阅读 · 2023年4月13日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

专知

53+阅读 · 2019年12月22日

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

专知

38+阅读 · 2019年6月18日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

专知

10+阅读 · 2018年9月8日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

课程 | 从零开始精通深度学习

课程 | 从零开始精通深度学习

机器之心

10+阅读 · 2017年10月24日

时滞微分差分系统的最小周期问题--天元数学交流项目

国家自然科学基金

0+阅读 · 2017年12月31日

天元数学东北地区青年教师培训项目

国家自然科学基金

2+阅读 · 2016年12月31日

第九届海峡两岸图论与组合学研讨会

国家自然科学基金

1+阅读 · 2016年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

40+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

492+阅读 · 2023年3月31日

Vision-Language Pre-training: Basics, Recent Advances, and Future Trends

Arxiv

28+阅读 · 2022年10月17日

Deep Meta-learning in Recommendation Systems: A Survey

Arxiv

13+阅读 · 2022年6月9日

Forecasting: theory and practice

Arxiv

57+阅读 · 2022年1月5日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

ResMLP: Feedforward networks for image classification with data-efficient training

Arxiv

12+阅读 · 2021年5月7日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

VIP会员

相关主题

视觉语言模型

相关VIP内容

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

专知会员服务

12+阅读 · 11月1日

CVPR2025开会了！《视觉基础模型》最新进展教程

CVPR2025开会了！《视觉基础模型》最新进展教程

专知会员服务

17+阅读 · 6月13日

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

专知会员服务

59+阅读 · 2024年3月2日

【AAAI2024教程】大模型知识编辑，192页ppt

【AAAI2024教程】大模型知识编辑，192页ppt

专知会员服务

82+阅读 · 2024年2月29日

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

专知会员服务

31+阅读 · 2024年2月28日

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

专知会员服务

54+阅读 · 2024年2月25日

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

专知会员服务

94+阅读 · 2024年2月21日

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

专知会员服务

82+阅读 · 2023年2月15日

【AAAI2023教程】大规模深度学习优化技术，109页ppt

【AAAI2023教程】大规模深度学习优化技术，109页ppt

专知会员服务

63+阅读 · 2023年2月10日

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

专知会员服务

60+阅读 · 2023年2月9日

热门VIP内容

开通专知VIP会员享更多权益服务

自动驾驶轨迹规划中的基础模型：进展综述与开放挑战

《用于提升多域战备的大型语言模型辅助场景生成器》报告

【斯坦福博士论文】为人类使用优化 AI 模型

国防领域人工智能规模化应用的理论与实践

相关资讯

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

PaperWeekly

19+阅读 · 2023年4月13日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

专知

53+阅读 · 2019年12月22日

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

专知

38+阅读 · 2019年6月18日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

专知

10+阅读 · 2018年9月8日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

课程 | 从零开始精通深度学习

课程 | 从零开始精通深度学习

机器之心

10+阅读 · 2017年10月24日

相关基金

时滞微分差分系统的最小周期问题--天元数学交流项目

国家自然科学基金

0+阅读 · 2017年12月31日

天元数学东北地区青年教师培训项目

国家自然科学基金

2+阅读 · 2016年12月31日

第九届海峡两岸图论与组合学研讨会

国家自然科学基金

1+阅读 · 2016年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

40+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

492+阅读 · 2023年3月31日

Vision-Language Pre-training: Basics, Recent Advances, and Future Trends

Arxiv

28+阅读 · 2022年10月17日

Deep Meta-learning in Recommendation Systems: A Survey

Arxiv

13+阅读 · 2022年6月9日

Forecasting: theory and practice

Arxiv

57+阅读 · 2022年1月5日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

ResMLP: Feedforward networks for image classification with data-efficient training

Arxiv

12+阅读 · 2021年5月7日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

微信扫码咨询专知VIP会员