首页 /研究 /从想象未来到可执行动作:用于机器人操作的潜动作混合模型
MANIPULATION开放获取

从想象未来到可执行动作:用于机器人操作的潜动作混合模型

Yajie Li, Bozhou Zhang, Chun Gu, Zipei Ma, Jiahui Zhang, Jiankang Deng, Xiatian Zhu, Li Zhang

2026

摘要

本文提出MoLA(潜动作混合模型),通过混合预训练逆动力学模型从预测的未来视频中推断潜动作,弥合视频想象与策略执行之间的鸿沟。该方法利用互补的语义、深度和光流线索,生成结构化且物理可解释的动作表示,从而提升机器人操作的稳定性和控制相关性。

关键词

video generationinverse dynamicslatent actionsrobot manipulationimagination

相关论文