DeepSeek代码库现神秘标识符“MODEL1”,新一代旗舰或于 2 月亮相
创始人
2026-01-26 22:19:57

国产 AI 领头羊DeepSeek近期动作频频,继 R1 模型发布一周年后,其技术动向再次引发开发者圈震动。根据最新的GitHub代码提交记录显示,在DeepSeek更新的 FlashMLA 代码中,被发现存在大量指向未知模型“MODEL1”的标识符。

这份横跨上百个文件的代码库中,有多处将“MODEL1”与现有的V3.2 版本并列提及,暗示这并非现架构的简单迭代,而极有可能是一个全新的模型序列。技术层面的细节差异进一步印证了这一猜想:新架构在键值(KV)缓存布局、稀疏性处理逻辑以及对 FP8 数据格式的解码支持上,均展现出与V3 系列不同的设计思路,这通常意味着模型在计算效率与显存优化上实现了新的突破。

此前已有消息指出,DeepSeek计划在 2026 年农历新年期间发布名为DeepSeek V4的旗舰模型,主打更强悍的代码编写能力。结合近期官方发布的关于“优化残差连接(mHC)”以及“AI 记忆模块(Engram)”的两篇重磅论文,外界普遍猜测“MODEL1”正是这些尖端科研成果的工程化落地。

相关内容

热门资讯

原创 黄... 黄磊和孙莉带着他们的二女儿以及刚出生的三胎儿子,一家四口悠闲地游玩广东。自从嫁入黄磊的家庭后,孙莉几...
【安庆新闻联播】春茶采摘正当时... 安庆各地立足生态资源禀赋和茶产业基础,以茶旅融合为主线,推动生态优势向产业优势、发展优势转化,走出一...
南京位列五一酒店预订热门目的地... 近日,同程旅行发布的《2026年五一旅行趋势报告》显示,南京位列五一假期酒店预订热门目的地TOP2,...
旅行是疲惫生活的解药:2026... 旅行,是我们给自己的温柔奖励 会不会你也常常有感觉到些许疲惫的时候呢,日子被工作以及那些琐碎的事情给...
暑假带孩子来伊犁研学?这份哈萨... 暑假带孩子来伊犁研学?这份哈萨克非遗与草原生态深度游攻略请收好! 每年暑假,都有许多像您一样的家长,...