首页 /研究 /离线语义引导的高效视觉-语言-动作策略蒸馏
MANIPULATION开放获取

离线语义引导的高效视觉-语言-动作策略蒸馏

Jin Shi, Brady Zhang, Yishun Lu

2026

摘要

该论文提出VLA-AD蒸馏框架,利用视觉语言模型作为离线语义监督器,将大型VLA教师策略压缩为轻量级学生策略。在LIBERO基准测试中,该方法将模型参数减少44倍,推理速度提升3.28倍,同时保持与教师策略接近的性能。

关键词

vision-language-actiondistillationsemantic guidancerobotic manipulationpolicy compression

相关论文