首页 /研究 /延迟共享POMDP中分散式团队均衡的私有与公共信息状态:基于动态规划的方法
OTHER开放获取

延迟共享POMDP中分散式团队均衡的私有与公共信息状态:基于动态规划的方法

Charalambos D. Charalambous, Umarbek Guvercin, Seddik Djouadi

2026

摘要

本文基于Witsenhausen的延迟共享信息模式,提出了分散式部分可观测马尔可夫决策过程(POMDP)中最优策略的结构性质,并建立了相应的动态规划方程。通过引入分散式序贯团队均衡概念,该框架将每个智能体的策略优化压缩到其动作空间,实现了类似集中式POMDP动态规划的关键特性。

关键词

decentralized POMDPdelayed sharingdynamic programmingteam equilibriuminformation states

相关论文