华为大模型也加入开源大军了
创始人
2025-06-30 19:11:30

作者 | 黄昱

编辑 | 刘宝丹

自四年前盘古大模型首次亮相以来,AI大模型行业风云变幻,不少AI大模型厂商加入开源大军。一直坚持闭源大模型的华为,如今也终于决定打开盘古的大门了。

6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。

这是华为首次开源盘古大模型。

华为方面表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

据悉,盘古Pro MoE 72B模型权重、基础推理代码,基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台;盘古7B相关模型权重与推理代码将于近期上线开源平台。

华为首次开源大模型选择了两款可应用广泛的模型。

70亿参数的稠密模型采用双系统框架,参数量适中、性能均衡、部署门槛较低,具备“快思考”和“慢思考”能力,可根据任务复杂度自动切换推理模式。

同时,该模型专为在昇腾 NPU 上优化部署,兼顾推理速度与推理深度,在 AIME、GPQA 等复杂推理基准测试中,超越 Qwen3-8B、GLM4-9B 等同量级模型,适用于智能客服、知识库等场景。

盘古Pro MoE 720亿参数的混合专家模型通过在专家选择阶段引入分组机制,确保了跨设备的计算负载均衡,不仅解决了传统MoE架构中专家负载不均衡的问题,还显著提升了模型的训练效率和推理性能,更适合处理相对复杂的任务。

AI大模型浪潮掀起以来,“大模型开源or闭源”一直是业界的热门议题。大模型开源的本质是以开放换生态,以生态养技术,相对于闭源而言,可以借助全球开发者的力量加速大模型的研发迭代速度。

开源与闭源也可以理解为是 “短期盈利” 与 “长期生态” 的权衡:闭源像 “专利药”,靠技术壁垒快速赚钱,但可能被后来者颠覆;开源像 “通用药”,靠规模效应和生态黏性构建护城河,但需要长期投入。

今年春节期间DeepSeek的横空出世,彻底颠覆了整个AI行业,也成功彰显了开源的价值。

在DeepSeek的推动下,AI应用爆发,海内外公司纷纷在自家产品中接入DeepSeek,直接冲击了OpenAI等AI大模型厂商在人工智能领域的市场地位。

基于此,像OpenAI、百度这样的坚定的闭源路线支持者,不得不在“技术护城河”与“商业价值”之间做出选择,也决定拥抱开源。

2 月 14 日,百度宣布,文心大模型 4.5 系列即将面世,且 6 月 30 日起全面开源。不约而同地,Open AI首席执行官山姆·奥特曼也在2月13日称,未来将重新制定开源战略。

百度创始人李彦宏在2月11日的World Governments Summit 2025峰会上表示:“开源能让你更吸睛。”他解释,AI、生成AI现在还处在创新萌芽期,快速传播能加速普及,吸引更多人试水,形成良性循环。

山姆·奥特曼则表态称,OpenAI在开源AI软件方面“一直站在历史的错误一边”。他还透露,虽然并非所有员工都同意其观点,但OpenAI内部正讨论公开AI模型的权重等事宜。

有AI业内人士指出,未来,“开源生态 + 闭源核心” 的混合模式可能成为主流 —— 既通过开源吸引开发者共建生态,又通过闭源技术保持商业竞争力,实现短期盈利与长期布局的平衡。

在此背景下,华为部分开源盘古大模型也是大势所趋。

此外,华为此次还开源了基于昇腾的模型推理技术,昇腾这一层级对应的则是华为瞄准的AI算力市场。

众所周知,华为的野心在于要做AI时代的“黑土地”,其昇腾生态战略是华为围绕昇腾 AI 计算平台构建的全方位生态发展策略,旨在推动 AI 技术普及应用、促进产业创新、实现各方共赢,涵盖技术创新、生态构建、开源开放、人才培养等多个关键层面。

开源盘古大模型,有利于吸引开发者基于盘古大模型开发行业应用,形成 “模型 - 应用 - 硬件”的昇腾生态闭环。

在6月20日召开的华为开发者大会2025上,华为常务董事、华为云计算CEO张平安在发布盘古大模型5.5的同时,还正式宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力。

据悉,华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍。

值得一提的是,超节点架构能更好地支持混合多专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。

盘古大模型基于昇腾云的全栈软硬件训练,因此,华为开源盘古大模型的本质,也是在为昇腾生态引流。

2025年已是开源模型快速进步的一年,华为如今加入开源大军,无疑将让其在全球AI竞争中占据战略主动。

相关内容

热门资讯

今日重大通报“皇豪互娱牛牛透视... 您好:皇豪互娱牛牛这款游戏可以开挂,确实是有挂的,需要软件加微信【5951795】,很多玩家在皇豪互...
辅助神器“WPK线上透视作弊挂... 辅助神器“WPK线上透视作弊挂脚本+透视挂!(详细透视教程)-知乎是一款可以让一直输的玩家,快速成为...
亲测!揭秘!小南娱乐外挂辅助器... 您好,小南娱乐这款游戏可以开挂的,确实是有挂的,通过微信【29290261】很多玩家在这款游戏中打牌...
今日分享“新奇玩乐有没有透视挂... 您好,新奇玩乐辅助软件这款游戏可以开挂的,确实是有挂的,需要了解加微【3696223】很多玩家在这款...
辅助神器“WPK俱乐部透视作弊... 亲,WPK俱乐部这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好...