Despite remarkable progress in Vision-Language Navigation (VLN), existing benchmarks remain confined to fixed, small-scale datasets with naive physical simulation. These shortcomings limit the insight that the benchmarks provide into sim-to-real generalization, and create a significant research gap. Furthermore, task fragmentation prevents unified/shared progress in the area, while limited data scales fail to meet the demands of modern LLM-based pretraining. To overcome these limitations, we introduce VLNVerse: a new large-scale, extensible benchmark designed for Versatile, Embodied, Realistic Simulation, and Evaluation. VLNVerse redefines VLN as a scalable, full-stack embodied AI problem. Its Versatile nature unifies previously fragmented tasks into a single framework and provides an extensible toolkit for researchers. Its Embodied design moves beyond intangible and teleporting "ghost" agents that support full-kinematics in a Realistic Simulation powered by a robust physics engine. We leverage the scale and diversity of VLNVerse to conduct a comprehensive Evaluation of existing methods, from classic models to MLLM-based agents. We also propose a novel unified multi-task model capable of addressing all tasks within the benchmark. VLNVerse aims to narrow the gap between simulated navigation and real-world generalization, providing the community with a vital tool to boost research towards scalable, general-purpose embodied locomotion agents.


翻译:尽管视觉语言导航(VLN)领域取得了显著进展,但现有基准仍局限于固定的小规模数据集和简单的物理仿真。这些缺陷限制了基准在仿真到现实泛化方面所能提供的洞见,并造成了显著的研究空白。此外,任务碎片化阻碍了该领域的统一/共享进展,而有限的数据规模亦无法满足基于现代大语言模型的预训练需求。为克服这些局限,我们提出了VLNVerse:一个全新的大规模、可扩展基准,专为通用、具身、真实仿真与评估而设计。VLNVerse将VLN重新定义为可扩展的全栈具身人工智能问题。其通用特性将先前碎片化的任务统一至单一框架,并为研究者提供可扩展的工具包。其具身设计超越了无形且可瞬移的“幽灵”智能体,在基于稳健物理引擎的真实仿真中支持完整运动学。我们利用VLNVerse的规模与多样性,对现有方法(从经典模型到基于多模态大语言模型的智能体)进行了全面评估。同时,我们提出了一种新颖的统一多任务模型,能够处理基准内的所有任务。VLNVerse旨在缩小仿真导航与现实世界泛化之间的差距,为学界提供关键工具以推动可扩展通用具身移动智能体的研究。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员