首页 /研究 /概率递归意图切换模型
LEARNING开放获取

概率递归意图切换模型

Wenyuan Sheng, Hao Zhu, Joschka Boedecker

2026

摘要

本文提出概率递归意图切换模型(PRISM),利用轻量级递归网络替代传统多意图逆强化学习中的马尔可夫链或固定历史窗口,实现每步意图分布建模。实验证明该方法在非马尔可夫网格世界、小鼠迷宫及BridgeData V2机器人操作任务中均取得最高留出对数似然,并能从无标签演示中恢复可命名的、时间连贯的意图。

关键词

inverse reinforcement learningintention switchingrecurrent neural networkmulti-intention IRLrobotic manipulation

相关论文