2月5日,由中科曙光提供的3套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池,全面覆盖万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景。
人工智能大模型正向万亿级参数快速发展,对算力提出前所未有的挑战。此次上线的scaleX万卡超集群,标志着国产万卡集群正式迈入规模化部署与实战应用新阶段。
该超集群基于AI计算开放架构,可全面兼容CUDA等主流软件生态,支持多品牌国产加速卡混合部署,降低开发者迁移适配门槛,并具备向十万卡、百万卡规模灵活扩展的能力。它已成为国家超算互联网郑州节点的核心AI算力支撑,依托国家超算互联网实现一体化算力调度,旨在为全球用户提供通用、易用、高效、普惠的AI算力。
在创新生态方面,scaleX万卡超集群已完成400多个主流大模型、世界模型的适配优化,并可接入上千款应用,链接更多AI产业生态伙伴,实现“算力+应用”一体化交付。
其实际应用深度赋能多场景:
1. 针对超大规模模型训练,支持万亿参数模型的整机训练与容错恢复。
2. 面向高通(QCOM)量推理场景,已服务于多家头部互联网用户的核心智能化业务,并通过联合优化持续提升推理效能。
3. 在AI for Science领域,支撑国内某材料研发大模型登顶国际权威榜单,助力将蛋白质研究效率提升3-6个数量级;同时搭配OneScience科学大模型一站式开发平台,降低多学科交叉研究的创新门槛。
在业内看来,中科曙光 3 套万卡超集群落地,填补了国内大规模国产算力规模化运营的空白,推动智算行业从单点技术突破迈入体系化实战阶段。其破解了大规模集群通信延迟、资源调度等行业痛点,算力密度、网络性能大幅提升,还实现多品牌国产加速卡兼容,大幅降低产业向国产算力迁移的适配成本,为行业树立了技术标杆。
同时,该算力池接入全国算力调度体系,带动国产算力全产业链需求释放,推动芯片、服务器、液冷等环节技术升级与市场扩容。其打造的成熟算力应用环境,也加速了大模型、AI for Science 等领域的技术创新与产业落地,助力行业形成 “算力+生态+应用” 的良性发展格局,提升国产算力在全球市场的竞争力。