DeepSeek-V3模型更新,开源协议更宽松,编程能力大幅提升
AI导读:
DeepSeek发布了小版本更新后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,模型参数增至6850亿。此次更新将开源协议更新为MIT协议,编程能力显著提升,尤其是生成前端代码的能力。新版DeepSeek-V3在网站开发和UI设计方面表现出色,审美比肩Claude 3.7 Sonnet。
3月24日晚间,Deepseek发布了小版本更新后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,模型参数增至6850亿,相比初代V3版本略有提升。此次更新,DeepSeek继续坚持开源,将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1相同的MIT协议,该协议更为开放,允许模型蒸馏和商用,为开发者提供了更多自主权。

在性能优化方面,新版本DeepSeek-V3的编程能力显著提升,尤其是生成前端代码的能力。这一改进成为新版本的最大亮点。

网友利用新版DeepSeek-V3设计的天气页面和个人网站页面,展示了模型在网站开发和UI设计方面的强大能力。新版本只需简单文本提示,即可快速开发各种网站和App,审美水平媲美全球顶尖的闭源代码模型Claude 3.7 Sonnet。



据多位博主测试,新版DeepSeek-V3在网站开发、UI设计方面表现出色,审美比肩Claude 3.7 Sonnet。



《科创板日报》曾报道,初代DeepSeek-V3上线便以高性价比著称。在多项基准测试中,DeepSeek-V3超越其他开源模型,性能与顶尖闭源模型相当。
幻方量化在论文中强调,通过优化算法、框架和硬件,DeepSeek-V3的训练成本极低。假设H800GPU租用价格为每块GPU2美元/小时,DeepSeek-V3的全部训练成本仅为557.6万美元。
此外,DeepSeek-V3的API服务定价也进行了调整,每百万输入tokens价格为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens价格为8元。相比之下,同类型模型如OpenAI的GPT 4o定价较高。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。