首页 /研究 /什么限制了视觉与语言导航?
LOCOMOTION开放获取

什么限制了视觉与语言导航?

Yunheng Wang, Yuetong Fang, Taowen Wang, Lusong Li, Kun Liu, Junzhe Xu, Zizhao Yuan, Yixiao Feng, Jiaxi Zhang, Wei Lu, Zecui Zeng, Renjing Xu

2026

摘要

本文分析了视觉与语言导航(VLN)在从模拟到真实部署中性能下降的原因,指出感知不稳定和指令模糊是关键瓶颈。作者提出StereoNav框架,通过目标位置先验和立体视觉增强空间接地与深度感知,提升真实世界导航的鲁棒性。

关键词

vision-and-language navigationembodied intelligencespatial groundingstereo visiondomain adaptation

相关论文