据《华尔街日报》周五晚间报道,英伟达公司正在开发一款专用推理处理器,该处理器将被OpenAI等人工智能公司用于开发更快速、更高效的模型。
这款新的推理平台预计将在本月晚些时候于圣何塞举行的英伟达年度GTC开发者大会上发布,并将整合该公司去年12月从芯片初创公司Groq收购的技术。
推理是指在生产环境中运行已训练AI模型的过程,已成为AI行业的关键关注领域。英伟达的竞争对手如谷歌和亚马逊云服务都开发了专门的推理芯片来与其图形处理器竞争,同时还面临来自Cerebras Systems和SambaNova Systems等专业推理芯片初创公司的竞争。
据报道,OpenAI已获得英伟达新推理芯片的早期使用权,并将成为最早的采用者之一,这对这家芯片制造商来说是一个重大胜利。尽管OpenAI一直在寻找比英伟达GPU更高效的替代方案以实现计算堆栈的多样化,但上周它从这家全球顶级芯片制造商获得了300亿美元的资金支持,重申了对该公司的承诺。
英伟达是全球最主要的GPU制造商,GPU是能够同时执行数十亿项任务的专用处理器。但尽管该公司继续坚持认为GPU在训练和推理方面都很有用,其GPU在为AI应用提供动力方面已不再被认为是最高效的选择。许多公司发现英伟达的芯片耗能过高,使得它们在智能体等应用中成本极其昂贵,这些智能体需要代表人类用户自主执行任务并需要巨大的计算能力。
这就是为什么OpenAI上个月与Cerebras签署了价值数十亿美元的合同,以获得其餐盘大小的推理专用芯片。Cerebras声称其芯片在推理任务方面比英伟达的GPU快得多。
据报道,英伟达的推理芯片将整合Groq开发的技术。英伟达在去年12月以200亿美元的价格非独家许可了Groq的技术,作为交易的一部分,还聘请了其创始首席执行官Jonathan Ross和总裁Sunny Madra。这被称为硅谷历史上最大的"收购招聘"之一。
Groq的推理芯片被称为"语言处理单元",它们基于全新的架构,能够以更低的能耗执行推理。然而,英伟达尚未透露如何计划使用这家初创公司的技术。
据报道,OpenAI希望使用英伟达的新推理芯片来为其Codex编程工具提供动力,该工具是Anthropic公司Claude Code的竞争对手。编程应用已成为生成式AI最强大和最有利可图的用例之一,这是OpenAI仅次于市场领导者Claude Code的领域。
英伟达还在推广其中央处理器作为运行推理工作负载的另一种选择。传统上,大多数公司将其GPU与CPU配对使用,利用两种芯片协同工作来补偿彼此的低效率。
但英伟达表示,一些智能体AI工作负载实际上可以在其最先进的Grace CPU上单独运行得更高效。上个月,Meta平台公司成为首家承诺进行首次大规模纯CPU部署的公司,以支持其广告定向智能体在生产环境中的运行。
Q&A
Q1:英伟达为什么要开发专门的推理芯片?
A:因为虽然英伟达的GPU在AI训练方面表现出色,但在推理任务中已不再是最高效的选择。许多公司发现英伟达的芯片耗能过高,在智能体等需要巨大计算能力的应用中成本极其昂贵,因此市场需要更节能的推理专用处理器。
Q2:英伟达的新推理芯片会整合哪些技术?
A:新推理芯片将整合英伟达去年12月从芯片初创公司Groq收购的技术。Groq的推理芯片被称为"语言处理单元",基于全新架构,能够以更低的能耗执行推理任务,比传统GPU更加高效节能。
Q3:OpenAI会如何使用英伟达的新推理芯片?
A:据报道,OpenAI已获得英伟达新推理芯片的早期使用权,计划用它来为Codex编程工具提供动力。Codex是OpenAI开发的编程助手工具,与Anthropic公司的Claude Code竞争,编程应用已成为生成式AI最有利可图的用例之一。