LEARNING开放获取📊 0 引用
基于随机解耦策略梯度的高效在线视觉强化学习
Haoxiang You, Yilang Liu, Davis Zong, Qian Wang, Teeratham Vitchutripop, Qi Wang, Daniel Rakita, Ian Abraham
2026
摘要
提出随机解耦策略梯度(SDPG)方法,通过轨迹滚动的随机扰动估计策略梯度,大幅减少批渲染环境数量与计算内存开销。在视觉MuJoCo基准测试中,SDPG在训练时间、内存使用和奖励方面均优于基线方法,并展示了从仿真到真实硬件的有效迁移。
关键词
visual reinforcement learningpolicy gradientsample efficiencysim-to-real
相关论文
LEARNING
开放获取📊 1 引用
面向学习与规划的并行可微可达性:具有认证神经动力学与控制器的系统
Keyi Shen, Glen Chou
2026
LEARNING
📊 0 引用
人工智能增强的智能焊接岛:基础模型革新制造业
Xiwei Wu, Wei Wu, Qiqi Chen 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于深度强化学习和动态图神经网络的多任务机器人调度代理
Hedi Boukamcha, Anas Neumann, Monia Rekik 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于微调与AAS增强检索的LLM驱动自动化DFA评估
Jiaxin Liu, Xiaofeng Zhou, Suyang Yu 等 8 位作者
Robotics and Computer-Integrated Manufacturing · 2026