首页 /研究 /反馈世界模型实现扩散策略的精确引导
LEARNING开放获取

反馈世界模型实现扩散策略的精确引导

Tuo An, Jindou Jia, Gen Li, Jingliang Li, Chuhao Zhou, Pengfei Liu, Bofan Lyu, Jiaqi Bai, Xinying Guo, Geng Li, Jianfei Yang

2026

摘要

本文提出反馈世界模型,在推理时通过在线更新轻量级反馈状态来闭环预测与观测,从而纠正模型误差。该方法无需额外训练数据或参数更新,即可提升扩散策略在分布外状态下的控制精度。

关键词

world modeldiffusion policyfeedback correctiononline adaptationlatent observer

相关论文