上海AI独角兽MiniMax发布混合架构开源模型M1
创始人
2025-06-17 16:41:39

6月17日,总部位于上海的AI独角兽企业MiniMax突然向开源社区投下一枚“重磅炸弹”,正式发布其自主研发的MiniMax-M1系列模型。MiniMax透露,M1的发布仅仅是MiniMax“开源周”的序幕。在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新。

上证报中国证券网讯(记者 谭镕)6月17日,总部位于上海的AI独角兽企业MiniMax突然向开源社区投下一枚“重磅炸弹”,正式发布其自主研发的MiniMax-M1系列模型。MiniMax透露,M1的发布仅仅是MiniMax“开源周”的序幕。在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新。

在业内人士看来,人工智能竞赛进入“下半场”的今天,模型性能的比拼已不再是唯一焦点,高效、低成本、强推理能力正成为定义下一代AI核心竞争力的关键。MiniMax介绍,M1被定义为“开源大规模混合架构推理模型”,在多个核心生产力场景中展现出比肩甚至超越业界顶尖模型的实力,为AI的规模化应用和未来发展路径提供了全新的想象空间。

技术报告显示,M1模型在处理百万级Token的长文本上实现了重大突破;其RL(强化训练)成本下降一个量级,成本仅53万美元,推理效率高;在工具使用场景(TAU-bench)中MiniMax-M1-40k领跑所有开源权重模型。

“性价比新王”“又一次卷到硅谷了”……M1发布后,技术社区和行业观察者表示。不少业内人士关注到M1的极致性价比。

具体来看,M1的性价比体现在API服务上。在0-32k的输入长度的时候,输入0.8元/百万token,输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token,输出16元/百万token;在最长的128k-1M的输入长度的时候,输入2.4元/百万token,输出24元/百万token。

此外,MiniMax宣布,在其自有的App和Web端,M1模型将保持不限量免费使用,这将极大地推动其技术的普及和应用。

MiniMax介绍,性能上,MiniMax在业内公认的17个主流评测集上对M1进行了全面“大考”,结果显示,M1在软件工程、长文本理解和工具使用等面向生产力的复杂场景中,优势较为突出。在代码能力方面,M1-40k和M1-80k版本分别取得了55.6%和56.0%的成绩,稳居第一梯队。在长文本方面,依托百万级上下文窗口,M1系列在此项任务中表现惊艳;在工具调用方面,在模拟真实世界工具调用的复杂场景中,M1-40k模型领跑开源模型。

据介绍,MiniMax-M1的卓越性能,根植于其独特的架构设计和算法创新。其中,两大核心技术——线性注意力机制(Lightning Attention)混合构架和更快的强化学习算法CISPO,构成了其高效能、低成本的基石。

M1模型原生支持高达100万Token的上下文窗口,同时,还支持业内最长的8万Token推理输出。实现这一突破的关键,在于MiniMax的Lightning Attention混合构架。此外,MiniMax此次提出的CISPO算法,通过裁剪重要性采样权重,而非传统算法中调整Token的更新方式,来提升强化学习的效率和稳定性。

得益于CISPO的高效,M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本仅为53.5万美元。MiniMax官方表示,这一成本“比最初的预期少了一个数量级”,展示了其技术路线在成本控制上的巨大潜力。

此外,MiniMax表示,完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。同时,公司正积极与国家超算平台等业界主流开源框架合作,以确保开发者能够轻松、高效地部署和使用M1模型。

相关内容

热门资讯

推荐十款(德州牛仔)外挂辅助器... 您好:德州牛仔这款游戏是可以开挂的,确实是有挂的,咨询加微信4114961很多玩家在德州牛仔这款游戏...
郑钦文因右颈受伤突然退出柏林站 17日,郑钦文在开赛前退出WTA500柏林站。从官方签表上看,郑钦文的名字替换为美国选手克鲁格。按原...
推荐十款(游游棋牌)外挂辅助器... 您好:游游棋牌这款游戏是可以开挂的,确实是有挂的,咨询加微信4114961很多玩家在游游棋牌这款游戏...
推荐十款(聚游广东麻将)外挂辅... 您好,聚游广东麻将这款游戏可以开挂的,确实是有挂的,通过微信4114961很多玩家在这款游戏中打牌都...
推荐十款(一乐麻将)外挂辅助器... 一乐麻将推荐十款(一乐麻将)外挂辅助器脚本,(透视)详细开挂教程(2025已更新)(哔哩哔哩)是一款...