首页 /研究 /对数增长控制的策略梯度样本复杂度
LEARNING开放获取

对数增长控制的策略梯度样本复杂度

Qiuhua Pan, Yukai Shen, Liwei Zhang, Cailian Chen, Xinping Guan

2026

摘要

本文研究了针对对数增长控制的策略梯度样本复杂度问题,揭示了最优增益处的奇异结构(尖点障碍),并利用柯西核的对称性通过反射配对消除发散部分,从而解决了梯度估计方差无限大的困难。

关键词

policy gradientsample complexitylog-growth controlsingularityCauchy principal value

相关论文