AI导读:

近日,DeepSeek新模型“MODEL1”在开源社区曝光,预计2月将发布新一代旗舰模型V4。该模型在关键技术上与现有架构有所不同,体现了内存优化和计算效率的提升。同时,DeepSeek团队还发布了新训练方法和AI记忆模块的技术论文。

在DeepSeek-R1发布一周年之际,新模型“MODEL1”的项目名在开源社区悄然出现。近日,DeepSeek官方在GitHub更新了一系列FlashMLA代码,项目文件有数十处都提到了此前未公开的“MODEL1”大模型标识符。根据开发者的分析,“MODEL1”很可能代表一个不同于现有架构的新模型。如果它能上线,这将具有里程碑意义。此前已有报道称,DeepSeek将于2月发布新一代旗舰模型DeepSeek V4。在近一个月里DeepSeek团队陆续发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的 “AI记忆模块(Engram)”。