首页 /研究 /重新思考用于VLA初始化的VLM表示
LEARNING开放获取

重新思考用于VLA初始化的VLM表示

Weifeng Lin, Siyuan Huang, Hao Li, Tingwei Chen, Ruichuan An, Xinyu Wei, Jianbo Liu, Hongsheng Li

2026

摘要

本文系统研究了VLM表示在VLA初始化中的作用,发现原始预训练VLM表示是动作性能的关键,但具身VQA适配并非总是有益,且LoRA比全微调提供更可靠的初始化。通过分阶段LoRA训练结合机器人数据预训练可获得最佳VLA初始化效果。

关键词

Vision-Language-Action modelVLA initializationrepresentation learningLoRAembodied VQA

相关论文