DeepSeek新模型“MODEL1”现身开源社区

股市热点 2026-01-21 23:07:44 来源：上海证券报作者：网络

AI导读：

DeepSeek新模型“MODEL1”现身开源社区，引发业界关注。该模型可能代表DeepSeek下一代AI模型（R2或V4），具备强大的编程能力，并在业内引起了广泛讨论。

　　恰逢DeepSeek-R1模型发布一周年，DeepSeek新模型“MODEL1”现身开源社区。近日，DeepSeek官方在GitHub更新了一系列FlashMLA代码，涉及的114个文件中，有数十处提到了此前未公开的“MODEL1”大模型标识符。2025年2月，DeepSeek启动“开源周”，计划以每日解锁的形式逐步公开5个代码库，Flash MLA为首个开源项目。某些文件中，“MODEL 1”与已知的现有模型“V32”（即DeepSeek-V.3.2）并列提及。“MODEL1”或许代表一个不同于现有架构的新模型，可能正是DeepSeek还未对外发布的下一代模型（R2或者V4）。此前有市场消息称，DeepSeek计划在2月春节前后发布新一代AI模型DeepSeek V4，但发布时间可能会视实际情况而变化。V4模型是DeepSeek 2024年12月发布的V3模型的迭代版，具备强大的编程能力。DeepSeek内部的初步测试显示，V4在编程能力上超过了目前市场上的其他顶级模型，如Anthropic的Claude和OpenAI的GPT系列。2026年1月以来，DeepSeek动作不断，已陆续发布了两篇技术论文，分别介绍了名为“优化残差连接（mHC）”的新训练方法，以及一种受生物学启发的 “AI记忆模块（Engram）”。

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。