AIPress.com.cn报道
4月7日消息,据 路透社报道,英伟达最近收购了 SchedMD,获得对开源调度软件 Slurm的控制权。Slurm 是全球约 60% 超级计算机使用的核心软件,同时也是 AI 模型训练的重要工具,包括 Anthropic的 Claude 模型训练都依赖于 Slurm。此次收购引发 AI 和超级计算机专家的广泛关注和争议。
Slurm 主要功能是调度计算任务,帮助超级计算机和数据中心高效分配计算资源。业内人士指出,英伟达拥有全球最有价值的 AI 芯片和超算硬件,收购 Slurm 可能让它在更新和优化软件时优先照顾自家硬件,而对 AMD、Intel 等竞争对手的硬件支持滞后,造成潜在的不公平竞争环境。五位熟悉 Slurm 的工程师和高管表示,他们担心这种偏向性可能在未来的 AI 模型训练和超算任务中产生实质性影响。英伟达在声明中表示:“Slurm 仍然是开源软件,我们将继续提供免费软件更新、培训和开发支持。”收购公告中也提到,公司希望借助自身资源加速 Slurm 的长期开发,推动 AI 与传统超级计算机任务采用新技术,同时保持软件的厂商中立性。
分析人士指出,此次收购与英伟达早前收购 Bright Computing 存在相似顾虑。Bright Computing 当时的软件虽然支持非英伟达硬件,但经过优化后在英伟达系统上性能最佳,非英伟达用户需要额外工作才能达到同等效果。AI 和超算社区因此高度关注英伟达如何处理 Slurm 的后续版本更新和平台兼容性。
目前,Slurm 已被 Meta、Mistral 和 Anthropic 等 AI 实验室在特定任务中使用。OpenAI 采用的是 Alphabet/Google 提供的替代调度系统。部分专家指出,英伟达的行为可能成为行业对开源工具公平性的一次“测试”,决定未来 AI 训练和超级计算机资源分配的生态格局。
Slurm 在超级计算机中的核心地位,使其不仅是科研和天气模拟等政府项目的关键工具,也成为 AI 前沿研发不可或缺的基础设施。此次收购意味着,AI 公司在使用 Slurm 管理非英伟达硬件时,可能面临性能优化和更新速度的不确定性,这对预算有限或多厂商环境的实验室和企业尤其重要。
此外,Slurm 的广泛采用也决定了英伟达在全球超算和 AI 市场中的潜在影响力。如果 Nvidia 优先优化自家芯片或 InfiniBand 网络产品,非英伟达用户可能需要额外投入适配资源,从而加大运营成本。这引发了业内对“开源工具被私有化”的关注。
总的来看,英伟达表示其目标是推动 Slurm 的发展和创新,同时保持开源和中立,但行业用户仍将密切关注其对多厂商生态的态度,以及在 AI 和超算领域的长期公平性。此次收购不仅是技术资产整合,也将影响未来 AI 基础设施的竞争格局。(AI普瑞斯编译)