基于符号世界模型的双层策略学习用于长时域规划

Dillon Z. Chen, Till Hofmann, Toryn Q. Klassen, Sheila A. McIlraith

摘要

本文提出BISON系统，通过结合低级模仿学习与高级符号抽象，实现长时域规划。实验表明该方法在MetaWorld基准测试中能有效泛化到更长的规划周期和更复杂的问题。

bilevel policysymbolic world modellong-horizon planningimitation learningembodied AI

LEARNING

📊 8,465 引用

D. O. Hebb

2005

LEARNING

📊 7,678 引用

Benoît B. Mandelbrot, John W. Van Ness

1968

LEARNING

开放获取📊 7,484 引用

Laith Alzubaidi, Jinglan Zhang, Amjad J. Humaidi 等 10 位作者

2021

LEARNING

📊 4,608 引用

Andre Esteva, Alexandre Robicquet, Bharath Ramsundar 等 10 位作者

2018