首页 /研究 /超越预训练的Muon再思考:VLA和RLVR中的频谱失败与高通补救方法
LEARNING开放获取

超越预训练的Muon再思考:VLA和RLVR中的频谱失败与高通补救方法

Chongyu Fan, Gaowen Liu, Mingyi Hong, Ramana Rao Kompella, Sijia Liu

2026

摘要

本文揭示了Muon优化器在跨模态VLA训练和RLVR中的频谱缺陷,并提出Pion优化器,通过高通NS迭代实现可控的频谱滤波,在保持计算效率的同时显著提升性能。

关键词

Muon optimizerspectral whiteninghigh-pass filtervision-language-actionreinforcement learning

相关论文