基于与芯片公司的持续合作伙伴关系,Red Hat承诺为英伟达新发布的Vera Rubin平台提供"第0天"支持,该平台将于今年晚些时候发布。
这家企业开源软件公司旨在缩小英伟达硬件平台发布与其自有支持软件堆栈正式发布之间的时间差,为Rubin平台设计了其旗舰操作系统Red Hat Enterprise Linux(RHEL)的定制版本。
英伟达的Vera Rubin平台旨在降低AI推理成本。该平台基于新的CPU、GPU和数字处理单元(DPU)构建,所有组件都与其他组件紧密集成。
据Red Hat发言人透露,该平台和Red Hat的软件都预计在2026年下半年推出。
当Rubin平台发布时,Red Hat存储库将提供经过验证的英伟达GPU OpenRM驱动程序和CUDA工具包。
Red Hat的软件还能够在英伟达新发布的机密计算安全架构框架内运行AI生命周期,该架构提供工作负载保护的加密证明。
除了RHEL,Red Hat还将为Rubin发布适用于Kubernetes的Red Hat OpenShift平台,Red Hat AI平台将扩展对分布式推理的支持,在Red Hat AI推理服务器、Red Hat Enterprise Linux AI和Red Hat OpenShift AI上支持英伟达的开源模型。
英伟达首席执行官黄仁勋在2025年消费电子展(CES)的主题演讲中介绍了Vera Rubin。该平台以美国天文学家薇拉·弗洛伦斯·库珀·鲁宾命名,她发现了占据宇宙大部分空间的暗物质。
这个平台承担着另一项艰难使命:降低运行大规模AI推理工作负载不断飙升的计算成本和电力使用成本。
通过工程化设计使组件更紧密地协同工作,Vera Rubin可以将训练模型的推理Token成本降低10倍,同时比传统用于此类任务的英伟达Blackwell平台少使用4倍的GPU。
该平台的以太网光子交换系统还承诺提供5倍的功耗效率改进。
Vera是该平台88核CPU的名称,Rubin是GPU的名称,提供50 PFLOPs的数学计算能力(是Blackwell的5倍)。英伟达BlueField-4 DPU还提供进一步的计算加速。这些处理单元都与NVLink 6交换机、英伟达ConnectX-9 SuperNIC和英伟达Spectrum-6以太网交换机紧密结合——所有这些都采用英伟达芯片制造。
随着公司加大AI投入,他们发现通过GPU最高效完成的推理工作成本越来越高。
本周,亚马逊云服务(AWS)将其GPU成本上调了15%。
推理成本确实一直是英伟达高管关注的问题。该公司还与Groq签署了200亿美元的推理和编译器技术许可协议。
在主题演讲中,英伟达的黄仁勋谈到了最近AI系统中推理使用的急剧增加。不仅模型本身变得更大,推理量本身也急剧增长。推理不再用于产生单一的"一次性"答案,而是一个"思考过程",通常涉及多个模型和额外的后训练。
因此需要更多推理计算。
"现在有强化学习,本质上是计算机尝试不同迭代学习如何执行任务,"黄仁勋说。"预训练、后训练、测试时扩展的计算量因此爆炸性增长。"
Anthropic联合创始人兼首席执行官Dario Amodei在声明中指出:"英伟达Rubin平台的效率提升代表了那种能够实现更长记忆、更好推理和更可靠输出的基础设施进步。"
除了Red Hat(隶属于IBM),其他承诺支持Rubin平台的公司还包括:AWS、Anthropic、思科、CoreWeave、戴尔、谷歌、HPE、Lambda、联想、Meta、微软、Mistral AI、OpenAI、甲骨文云基础设施(OCI)等众多公司。
Q&A
Q1:Vera Rubin平台是什么?有什么特别之处?
A:Vera Rubin是英伟达新发布的AI平台,专门用于降低AI推理成本。该平台基于新的CPU、GPU和数字处理单元构建,通过紧密集成的组件设计,可以将训练模型的推理Token成本降低10倍,同时比传统Blackwell平台少使用4倍GPU。
Q2:Red Hat为Vera Rubin平台提供什么支持?
A:Red Hat承诺为Vera Rubin平台提供"第0天"支持,包括定制版本的RHEL操作系统、经过验证的英伟达GPU OpenRM驱动程序和CUDA工具包。还将发布适用于Kubernetes的Red Hat OpenShift平台,并扩展Red Hat AI平台对分布式推理的支持。
Q3:Vera Rubin平台什么时候能够使用?
A:根据Red Hat发言人透露,Vera Rubin平台和Red Hat的配套软件都预计在2026年下半年正式推出。目前已有AWS、谷歌、微软、OpenAI等众多公司承诺支持该平台。