三维视觉-语言推理技术的前沿研究与最新趋势 - 专知VIP

会员服务 ·

16

三维视觉推理 · 视觉语言推理 ·

三维视觉-语言推理技术的前沿研究与最新趋势

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

三维视觉推理的核心思想对点云场景中的视觉主体间的关系进行理解。然而，非专业用户难以向计算机传达自己的意图，从而限制了该技术的普及与推广。为此，研究人员以自然语言作为语义背景和查询条件反映用户意图，进而与点云的信息进行交互以完成相应的任务。此种范式称作三维视觉-语言推理，近年来在自动驾驶、机器人导航以及人机交互等众多领域广泛应用，已经成为计算机视觉领域中备受瞩目的研究方向。过去三年间，三维视觉-语言推理技术迅猛发展，呈现出百花齐放的趋势，但是目前依旧缺乏对最新研究进展的全面总结。本文聚焦于两类最具代表性的研究工作，锚框预测和内容生成类的三维视觉-语言推理技术，系统性概括领域内研究的最新进展。首先，本文总结了三维视觉-语言推理的问题定义和现存挑战，同时概述了一些常见的骨干网络。其次，本文按照方法所关注的下游场景，对两类三维视觉-语言推理技术做了进一步细分，并深入探讨了各方法的优缺点。接下来，本文对比分析了各类方法在不同基准数据集上的性能。最后，本文展望了三维视觉-语言推理技术的未来发展前景，以期促进该领域的深入研究与广泛应用。

成为VIP会员查看完整内容

20

相关内容

三维视觉推理

三维视觉推理

基于主动学习的图像分类技术：现状与未来

基于主动学习的图像分类技术：现状与未来

专知会员服务

34+阅读 · 1月8日

基于图神经网络的小样本学习方法研究进展

基于图神经网络的小样本学习方法研究进展

专知会员服务

37+阅读 · 2023年11月18日

面向天域感知领域的知识图谱构建技术研究

面向天域感知领域的知识图谱构建技术研究

专知会员服务

48+阅读 · 2023年10月15日

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

专知会员服务

58+阅读 · 2023年4月14日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

13+阅读 · 2022年6月4日

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

专知会员服务

23+阅读 · 2022年1月20日

知识图谱推理：现代的方法与应用

专知会员服务

76+阅读 · 2021年7月23日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

42+阅读 · 2021年4月15日

深度卷积神经网络图像语义分割研究进展

专知会员服务

83+阅读 · 2021年1月7日

自然语言处理预训练模型的研究综述

专知会员服务

112+阅读 · 2020年12月9日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

23+阅读 · 2022年7月7日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

25+阅读 · 2020年12月3日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

25+阅读 · 2020年7月26日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

32+阅读 · 2020年6月17日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

33+阅读 · 2020年5月2日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

39+阅读 · 2018年3月19日

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

论智

12+阅读 · 2018年1月5日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义低秩矩阵重构算法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于检索优化的三维特征建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

4+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

72+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

141+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

327+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

21+阅读 · 2023年1月13日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Contrastive learning of global and local features for medical image segmentation with limited annotations

Arxiv

19+阅读 · 2020年6月18日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

18+阅读 · 2019年1月14日

VIP会员

相关主题

三维视觉推理

视觉语言推理

相关VIP内容

基于主动学习的图像分类技术：现状与未来

基于主动学习的图像分类技术：现状与未来

专知会员服务

34+阅读 · 1月8日

基于图神经网络的小样本学习方法研究进展

基于图神经网络的小样本学习方法研究进展

专知会员服务

37+阅读 · 2023年11月18日

面向天域感知领域的知识图谱构建技术研究

面向天域感知领域的知识图谱构建技术研究

专知会员服务

48+阅读 · 2023年10月15日

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

专知会员服务

58+阅读 · 2023年4月14日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

13+阅读 · 2022年6月4日

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

专知会员服务

23+阅读 · 2022年1月20日

知识图谱推理：现代的方法与应用

专知会员服务

76+阅读 · 2021年7月23日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

42+阅读 · 2021年4月15日

深度卷积神经网络图像语义分割研究进展

专知会员服务

83+阅读 · 2021年1月7日

自然语言处理预训练模型的研究综述

专知会员服务

112+阅读 · 2020年12月9日

热门VIP内容

相关资讯

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

23+阅读 · 2022年7月7日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

25+阅读 · 2020年12月3日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

25+阅读 · 2020年7月26日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

32+阅读 · 2020年6月17日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

33+阅读 · 2020年5月2日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

39+阅读 · 2018年3月19日

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

论智

12+阅读 · 2018年1月5日

相关基金

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义低秩矩阵重构算法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于检索优化的三维特征建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

4+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

相关论文

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

72+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

141+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

327+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

21+阅读 · 2023年1月13日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Contrastive learning of global and local features for medical image segmentation with limited annotations

Arxiv

19+阅读 · 2020年6月18日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

18+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员