首页 /研究 /IntentVLA:用于混叠机器人操作的短时域意图建模
MANIPULATION开放获取📊 0 引用

IntentVLA:用于混叠机器人操作的短时域意图建模

Shijie Lian, Bin Yu, Xiaopeng Lin, Zhaolong Shen, Laurence Tianruo Yang, Yurun Jin, Haishan Liu, Changti Wu, Hang Yuan, Cong Huang, Kai Chen

2026

摘要

IntentVLA提出了一种基于历史信息的视觉-语言-动作框架,通过编码近期视觉观测为紧凑的短时域意图表示来生成动作块,解决了部分可观测性下相邻重规划步骤间意图重采样导致的块间冲突问题。在多个基准测试中,该方法提升了滚动稳定性并优于强基线模型。

关键词

short-horizon intentobservation aliasingVLA policyrobot manipulationimitation learning

相关论文