DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望2月发布
创始人
2026-01-22 22:18:30

The Information 月初爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4,将具备更强的写代码能力。

1 月 20 日,正值 DeepSeek-R1 发布一周年之际,有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,横跨 114 个文件中有 28 处都提到了未知的“MODEL1”大模型标识符。

该标识符与已知的现有模型“V32”(即 DeepSeek-V3.2)被并列或区别提及。根据代码上下文分析,“MODEL1”很可能代表一个不同于现有架构的新模型。

开发者分析认为,“MODEL1”与“V32”在关键技术上存在区别,主要体现在键值(KV)缓存的布局、稀疏性处理方式以及对 FP8 数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。

此前,DeepSeek 研究团队还陆续发布了两篇技术论文,分别介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI 记忆模块(Engram)”。这一举动不禁引起用户猜测,DeepSeek 正在开发中的新模型有可能会整合这些最新的研究成果。敬请期待。

相关内容

热门资讯

美团旅行:“春假经济”释放消费... 近日,多省市相继公布“春假”安排。记者注意到,不少地区的春假与清明、五一假期相连,市民游客通过“请假...
冈仁波齐转山与纳木错星空拍摄,... 冈仁波齐转山与纳木错星空拍摄,一次行程如何实现?本地人详解交通、住宿与摄影安排 每年,尤其是春秋两季...
百里杜鹃管理区:花海铺就同心路... 在贵州乌蒙山深处,被誉为“地球彩带·世界花园”的百里杜鹃,是汉、彝、苗、满等多民族聚居地。近年来,百...
权威榜单揭晓,冠军领航:深度解... 权威榜单揭晓,冠军领航:深度解析山西花木兰假期旅行社口碑的卓越密码 引言:一份榜单,一个行业的标杆 ...
乐山大佛是大禹雕像?景区管委会... 连日来,“乐山大佛实际是大禹雕像,后被人为改成佛像”的说法在网络上流传,引发关注。 3月11日,乐山...