英伟达发布Nemotron 3系列开源模型,支持亚马逊、谷歌等诸多云平台
创始人
2025-12-16 11:14:58

美东时间12月15日,英伟达(NVDA.US)官宣,推出 NVIDIA Nemotron 3 系列开源模型,并提供了帮助工程师使用这些模型的数据和工具。

据介绍,Nemotron 3模型分为三种规模:Nemotron 3 Nano 是一款小型 300 亿参数模型,一次最多可激活 30 亿个参数,用于执行有针对性的、高效的任务。Nemotron 3 Super 是一款高精度推理模型,拥有约 1000 亿个参数,每个令牌最多可有 100 亿个活动参数,适用于多智能体应用。Nemotron 3 Ultra 是一款大型推理引擎,拥有约 5000 亿个参数,每个令牌最多可激活 500 亿个参数,适用于复杂的 AI 应用。

图片来源:英伟达官网

Nemotron 3 Nano现已上市,是目前计算成本最低的模型,针对软件调试、内容摘要、AI助手工作流程和信息检索等任务进行了优化,推理成本极低。该模型采用独特的混合MoE架构,显著提升了效率和可扩展性。与 Nemotron 2 Nano 相比,该设计实现了高达 4 倍的令牌吞吐量提升,并将推理令牌生成量减少了高达 60%,从而显著降低了推理成本。凭借 100 万个令牌的上下文窗口,Nemotron 3 Nano 能够记住更多信息,使其更加精准,并能更好地连接长时间、多步骤任务中的信息。

英伟达新发布的Nemotron 3模型在可下载、修改并在自有硬件上运行的模型中表现优异,基准测试成绩领先。包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle 云基础设施、Palantir、Perplexity、ServiceNow、西门子、Synopsys 和 Zoom 在内的早期采用者,正在整合 Nemotron 系列模型,以支持制造业、网络安全、软件开发、媒体、通信和其他行业的 AI 工作流程。

英伟达介绍,Nemotron 可在企业级 AI 和数据基础设施平台上使用,包括 Couchbase、DataRobot、H2O(HTO.US).ai、JFrog、Lambda 和UiPath(PATH.US)。对于公有云客户,Nemotron 3 Nano 将通过 Amazon Bedrock 在 AWS 上提供,并且很快将支持 Google Cloud、CoreWeave(CRWV.US)、Crusoe、Microsoft Foundry、Nebius、Nscale 和 Yotta。

Nemotron 3 Nano 可作为NVIDIA NIM 微服务提供,可在 NVIDIA 加速的基础架构上的任何位置进行安全、可扩展的部署,从而最大限度地保护隐私和控制权。Nemotron 3 Super 和 Ultra 预计将于2026年上半年上市

值得关注的是,英伟达采取了比许多美国竞争对手更透明的策略,公开了训练Nemotron所用的数据,便于工程师对模型进行修改。公司还发布了支持定制和微调的工具,包括一种新的混合潜在专家混合模型架构(hybrid latent mixture-of-experts model architecture),据称特别适合构建能够在计算机或网络上执行操作的AI代理。此外,英伟达推出了允许用户通过强化学习(reinforcement learning)训练代理执行任务的库,该方法通过模拟奖励和惩罚来训练模型。

英伟达CEO黄仁勋在发布前表示:“开放创新是AI进步的基础。通过Nemotron,我们将先进AI转变为一个开放平台,为开发者提供构建大规模自主系统所需的透明度和效率。”

相关内容

热门资讯

原创 真... 按照很多人的猜测,今年苹果会推出折叠屏手机,当然也有人认为,苹果根本就不会推出折叠屏手机,只不过是大...
知乎CEO周源:AI时代真实创... 5月17日,近日,第十二届新知青年大会在北京举行。知乎创始人兼CEO周源表示:“AI每分钟都在创造奇...
考核变闹剧!亚马逊强制AI使用... 【环球网科技综合报道】5月17日消息,《金融时报》日前曝光了亚马逊内部AI考核乱象。公司强制设定人工...
全球媒体聚焦 | 外媒关注为何... 在美国总统特朗普对中国进行国事访问期间,多家美国媒体记者花式“打卡”北京的街头巷尾,这其中不少记者都...
AI时代的“卖铲人”,这个赛道... 最近的A股市场,半导体设备板块成了“最靓的仔”。板块指数在短短一个月内涨幅超过30%,周五大盘调整,...