美团正式发布并开源其首款大模型LongCat-Flash,这款总参数达5600亿的混合专家模型(MoE)在推理效率上实现重大突破,理论每token输出速度较DeepSeek-V3提升近50%,性能指标全面追平行业标杆DeepSeek-V3.1。这一成果标志着美团在AI领域的战略布局从“地下”转向“明牌”,创始人王兴的“主动进攻”宣言正式落地。
LongCat-Flash的核心竞争力源于两项颠覆性架构设计:
零计算专家机制:通过动态分配算力资源,将简单token(如常见词汇)直接原样输出,不消耗计算资源,仅对复杂token(如逻辑推理部分)调用完整算力。这一设计使模型在相同算力预算下性能提升显著,内部测试显示代码生成效率较传统模型提高40%。
快捷连接架构(ScMoE):在层与层间引入跨层捷径,使稠密计算与专家并行通信完全重叠。实测中,该架构使理论每token输出时间缩短至0.01秒,较DeepSeek-V3降低50%,在100token输出任务中达到每秒100token的业界顶尖水平。
技术报告显示,LongCat-Flash在Agentic工具调用、指令遵循等场景达到开源模型SOTA(State-of-the-Art)水准。尽管在通用领域和编程能力上与头部模型存在差距,但其针对外卖、到店等本地生活场景的专项优化已显现成效。
2025年3月,王兴首次披露美团AI战略三层次:
AI at Work:内部工具全面智能化,LongCat已为工程师生成52%的代码,并推出智能会议助手、平面设计工具等10余款效率产品。
AI in Products:外卖、到店业务嵌入AI决策系统,商家经营助手计划于6月上线,可自动生成营销策略并预测消费趋势。
Building LLM:投入数十亿美元采购GPU资源,自研基座模型性能接近GPT-4o,LongCat-Flash的开源标志着技术生态进入开放阶段。
“美团的AI战略不是防御战,而是争夺未来十年科技制高点的总攻。”王兴在财报电话会上强调。2025年一季度财报显示,美团研发投入同比增长15%,其中AI相关支出占比超60%。
LongCat-Flash的开源引发连锁反应:
技术平权运动:模型上线Hugging Face、GitHub等平台后,中小开发者可免费调用其核心架构,预计将催生一批垂直领域AI应用。美团同步推出“龙猫开发者计划”,为优质项目提供算力补贴。
硬件适配突破:技术报告模糊提及“数万个加速卡”的国产供应链方案,虽未公布具体厂商,但业内推测其与华为昇腾、寒武纪等芯片完成深度适配,为国产算力生态提供关键验证。
价格战转向价值战:在DeepSeek-V3.1宣布API涨价的背景下,LongCat-Flash的免费开源策略形成鲜明对比。美团宣布将推出企业版API服务,定价较市场平均水平低30%,目标直指阿里云、腾讯云等传统巨头。
尽管取得阶段性胜利,美团仍面临三大考验:
多模态短板:当前版本暂不支持图像、视频生成,而百度、阿里已推出文生视频一体化模型,美团需加快研发进度。
数据壁垒突破:本地生活场景的AI应用依赖高质量行业数据,美团需在保护商家隐私前提下构建数据共享机制。
全球化竞争:随着Keeta外卖业务进军巴西、沙特等市场,LongCat需快速适配多语言环境,而OpenAI、Google等国际巨头已建立先发优势。
“AI革命不是单点技术的突破,而是整个商业系统的重构。”王兴在开源仪式上表示。据内部人士透露,美团正秘密研发人形配送机器人,计划将LongCat-Flash的决策能力与硬件载体结合,打造“AI+机器人+即时零售”的终极形态。