首页 /研究 /面向100兆瓦级AI集群的电力供应到运行时优化
OTHER开放获取

面向100兆瓦级AI集群的电力供应到运行时优化

Ehsan K. Ardestani, Leonardo Piga, Jovan Stojkovic, Pavan Balaji, Mustafa Ozdal, Mikel Jimenez Fernandez, Mihaela Dimovska, Luka Tadic, Hao Shen, Devika Vishwanath, Richa Mishra, Melaku Mihret, Valentin Andrei, Mauricio Cespedes, Julien Prigent, James Monahan, Tyler Graf, Bin Li, Charles Marquez, Shobhit Kanaujia

2026

摘要

本文首次描述了超大规模AI数据中心从早期电力规划到运行时动态管理的端到端过程,基于一个150兆瓦、包含83K GB200 GPU的集群实测数据。研究揭示了电力供应是当前AGI竞赛中的最大瓶颈,并分享了构建该集群的实践经验。

关键词

AI数据中心电力管理大规模集群GB200 GPU运行时优化

相关论文