LEARNING开放获取
概率递归意图切换模型
Wenyuan Sheng, Hao Zhu, Joschka Boedecker
2026
摘要
本文提出概率递归意图切换模型(PRISM),利用轻量级递归网络替代传统多意图逆强化学习中的马尔可夫链或固定历史窗口,实现每步意图分布建模。实验证明该方法在非马尔可夫网格世界、小鼠迷宫及BridgeData V2机器人操作任务中均取得最高留出对数似然,并能从无标签演示中恢复可命名的、时间连贯的意图。
关键词
inverse reinforcement learningintention switchingrecurrent neural networkmulti-intention IRLrobotic manipulation
相关论文
LEARNING
开放获取📊 1 引用
面向学习与规划的并行可微可达性:具有认证神经动力学与控制器的系统
Keyi Shen, Glen Chou
2026
LEARNING
📊 0 引用
人工智能增强的智能焊接岛:基础模型革新制造业
Xiwei Wu, Wei Wu, Qiqi Chen 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于深度强化学习和动态图神经网络的多任务机器人调度代理
Hedi Boukamcha, Anas Neumann, Monia Rekik 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于微调与AAS增强检索的LLM驱动自动化DFA评估
Jiaxin Liu, Xiaofeng Zhou, Suyang Yu 等 8 位作者
Robotics and Computer-Integrated Manufacturing · 2026