首页 /研究 /基于符号世界模型的双层策略学习用于长时域规划
LEARNING开放获取

基于符号世界模型的双层策略学习用于长时域规划

Dillon Z. Chen, Till Hofmann, Toryn Q. Klassen, Sheila A. McIlraith

2026

摘要

本文提出BISON系统,通过结合低级模仿学习与高级符号抽象,实现长时域规划。实验表明该方法在MetaWorld基准测试中能有效泛化到更长的规划周期和更复杂的问题。

关键词

bilevel policysymbolic world modellong-horizon planningimitation learningembodied AI

相关论文