LEARNING开放获取
鲁棒Koopman控制屏障滤波器用于安全演员-评论家强化学习
Dhruv S. Kushwaha, Zoleikha A. Biron
2026
摘要
该论文提出了一种名为鲁棒Koopman-CBF SAC的安全滤波演员-评论家框架,通过数据驱动的Koopman预测器构建仿射CBF约束,并利用二次规划安全层确保机器人系统在训练和部署中的安全性。实验表明该方法在CartPole稳定和跟踪任务中实现零约束违反,同时达到或超过无约束SAC的性能。
关键词
safe reinforcement learningcontrol barrier functionsKoopman operatoractor-criticrobotics
相关论文
LEARNING
开放获取📊 1 引用
面向学习与规划的并行可微可达性:具有认证神经动力学与控制器的系统
Keyi Shen, Glen Chou
2026
LEARNING
📊 0 引用
人工智能增强的智能焊接岛:基础模型革新制造业
Xiwei Wu, Wei Wu, Qiqi Chen 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于深度强化学习和动态图神经网络的多任务机器人调度代理
Hedi Boukamcha, Anas Neumann, Monia Rekik 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于微调与AAS增强检索的LLM驱动自动化DFA评估
Jiaxin Liu, Xiaofeng Zhou, Suyang Yu 等 8 位作者
Robotics and Computer-Integrated Manufacturing · 2026