LEARNING开放获取
R2R2:通过自预测学习中的冗余减少实现密集经验复用的鲁棒表示
Sanghyeob Song, Donghyeok Lee, Jinsik Kim, Sungroh Yoon
2026
摘要
本文提出了一种名为R2R2的正则化方法,用于解决自预测学习在高更新-数据比下的过拟合问题。实验表明,该方法在11个连续控制任务中有效提升了性能,并可与现有先进算法正交结合。
关键词
reinforcement learningself-predictive learningoverfittingredundancy reductioncontinuous control
相关论文
LEARNING
开放获取📊 1 引用
面向学习与规划的并行可微可达性:具有认证神经动力学与控制器的系统
Keyi Shen, Glen Chou
2026
LEARNING
📊 0 引用
基于深度强化学习和动态图神经网络的多任务机器人调度代理
Hedi Boukamcha, Anas Neumann, Monia Rekik 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
人工智能增强的智能焊接岛:基础模型革新制造业
Xiwei Wu, Wei Wu, Qiqi Chen 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
MANIPULATION
📊 0 引用
PAEAR:基于强化学习的点云区域探索与主动识别方法用于机器人焊接
Yong Tao, Donghua Tan, Fan Ren 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026