DeepSeek发布梁文锋署名新论文,提出“条件记忆”,开源相关记忆模块Engram
创始人
2026-01-13 18:18:27

【太平洋科技快讯】1 月 13 日消息,据《科创板日报》报道,DeepSeek 于 12 日晚发布最新研究论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文由北京大学与 DeepSeek 团队共同完成,DeepSeek 创始人梁文锋再次出现在合著作者名单中。

论文提出了“条件记忆”(conditional memory),与传统大模型架构相比,通过引入可扩展的查找记忆结构,在等参数、等算力条件下,显著提升了模型在知识调用、推理、代码和数学等任务上的表现。DeepSeek 同步开源了相关记忆模块 Engram。

相关内容

热门资讯

春节庐山全家游:带厨房民宿与九... 春节庐山全家游:带厨房民宿与九江站包车接送全攻略 春节带着一家老小上庐山过年,这个想法太棒了!庐山冬...
杭州是几朝古都?【古都系列6】 上有天堂,下有苏杭,杭州虽然风景秀丽,但是古都属性并不强,在“六大古都”中的存在感极低,与其它五个古...
原创 非... 非洲杯C组的最后悬念,最终以一种波澜不惊的方式解开了。突尼斯队没能拿下坦桑尼亚,但一场1-1的平局也...
敦煌食局深挖敦煌饮食文化:呈现... 1月13日,在位于甘肃省敦煌市敦煌食局内,游人享受夜市生活。据了解,敦煌食局是有着多年历史的沙州夜市...
安徽芜湖:房车露营 乐享假期 2026年1月11日,在安徽省芜湖市繁昌区峨山镇东岛村,游客在青年水库房车露营地休闲游玩,乐享假期生...