首页 /研究 /冻结的VLA已经知道成功:基础机器人策略中价值类结构的探测研究
MANIPULATION开放获取

冻结的VLA已经知道成功:基础机器人策略中价值类结构的探测研究

Jiachen Zhang, Junnan Nie, Junyi Lao, Wei Cheng, Chenghao Liu, Jiaxin Jiang, Songfang Huang

2026

摘要

本文研究了视觉-语言-动作(VLA)策略的冻结表示是否隐含奖励、进度或未来成功信息。通过线性探测从混合成功和失败的操控轨迹中恢复蒙特卡洛结果目标,并利用这些信息在测试时选择动作前缀,显著提升了推板等任务的成功率。

关键词

VLA policiesvalue probingmanipulationtest-time selectionLIBERO-Goal

相关论文