三维视觉推理的核心思想对点云场景中的视觉主体间的关系进行理解。然而,非专业用户难以向计算机传达自己 的意图,从而限制了该技术的普及与推广。为此,研究人员以自然语言作为语义背景和查询条件反映用户意图,进而与点云 的信息进行交互以完成相应的任务。此种范式称作三维视觉-语言推理,近年来在自动驾驶、机器人导航以及人机交互等众 多领域广泛应用,已经成为计算机视觉领域中备受瞩目的研究方向。过去三年间,三维视觉-语言推理技术迅猛发展,呈现 出百花齐放的趋势,但是目前依旧缺乏对最新研究进展的全面总结。本文聚焦于两类最具代表性的研究工作,锚框预测和内 容生成类的三维视觉-语言推理技术,系统性概括领域内研究的最新进展。首先,本文总结了三维视觉-语言推理的问题定义 和现存挑战,同时概述了一些常见的骨干网络。其次,本文按照方法所关注的下游场景,对两类三维视觉-语言推理技术做 了进一步细分,并深入探讨了各方法的优缺点。接下来,本文对比分析了各类方法在不同基准数据集上的性能。最后,本文 展望了三维视觉-语言推理技术的未来发展前景,以期促进该领域的深入研究与广泛应用。

成为VIP会员查看完整内容
20

相关内容

基于主动学习的图像分类技术:现状与未来
专知会员服务
34+阅读 · 1月8日
基于图神经网络的小样本学习方法研究进展
专知会员服务
37+阅读 · 2023年11月18日
面向天域感知领域的知识图谱构建技术研究
专知会员服务
48+阅读 · 2023年10月15日
【伯克利博士论文】机器人机械搜索的操作与感知策略
专知会员服务
13+阅读 · 2022年6月4日
专知会员服务
76+阅读 · 2021年7月23日
专知会员服务
42+阅读 · 2021年4月15日
专知会员服务
83+阅读 · 2021年1月7日
专知会员服务
112+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知
25+阅读 · 2020年12月3日
最新《动态网络嵌入》综述论文,25页pdf
专知
32+阅读 · 2020年6月17日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
A Survey of Large Language Models
Arxiv
327+阅读 · 2023年3月31日
Arxiv
56+阅读 · 2023年3月26日
Arxiv
16+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
基于主动学习的图像分类技术:现状与未来
专知会员服务
34+阅读 · 1月8日
基于图神经网络的小样本学习方法研究进展
专知会员服务
37+阅读 · 2023年11月18日
面向天域感知领域的知识图谱构建技术研究
专知会员服务
48+阅读 · 2023年10月15日
【伯克利博士论文】机器人机械搜索的操作与感知策略
专知会员服务
13+阅读 · 2022年6月4日
专知会员服务
76+阅读 · 2021年7月23日
专知会员服务
42+阅读 · 2021年4月15日
专知会员服务
83+阅读 · 2021年1月7日
专知会员服务
112+阅读 · 2020年12月9日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员