首页 /研究 /可视化运动策略中的潜在相位结构:基于时间特征扩展的多环境研究
LOCOMOTION开放获取

可视化运动策略中的潜在相位结构:基于时间特征扩展的多环境研究

Daisuke Yasui, Toshitaka Matuki, Hiroshi Sato

2026

摘要

本文提出了一种从深度强化学习训练的运动控制策略中揭示潜在运动相位结构的框架,通过扩展聚类特征(包括动作、下一状态和下一动作)并引入抑制自转移的聚类数确定方法。在Ant、HalfCheetah和Walker2D三个环境中验证了该方法能比现有方法识别出更清晰、更具规律性的相位转换规则。

关键词

locomotionreinforcement learningphase structurevisualizationMuJoCo

相关论文