AI导读:

DeepSeek发布了小版本更新后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,模型参数增至6850亿。此次更新将开源协议更新为MIT协议,编程能力显著提升,尤其是生成前端代码的能力。新版DeepSeek-V3在网站开发和UI设计方面表现出色,审美比肩Claude 3.7 Sonnet。


3月24日晚间,Deepseek发布了小版本更新后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,模型参数增至6850亿,相比初代V3版本略有提升。此次更新,DeepSeek继续坚持开源,将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1相同的MIT协议,该协议更为开放,允许模型蒸馏和商用,为开发者提供了更多自主权。

在性能优化方面,新版本DeepSeek-V3的编程能力显著提升,尤其是生成前端代码的能力。这一改进成为新版本的最大亮点。

网友利用新版DeepSeek-V3设计的天气页面和个人网站页面,展示了模型在网站开发和UI设计方面的强大能力。新版本只需简单文本提示,即可快速开发各种网站和App,审美水平媲美全球顶尖的闭源代码模型Claude 3.7 Sonnet。

据多位博主测试,新版DeepSeek-V3在网站开发、UI设计方面表现出色,审美比肩Claude 3.7 Sonnet。

科创板日报》曾报道,初代DeepSeek-V3上线便以高性价比著称。在多项基准测试中,DeepSeek-V3超越其他开源模型,性能与顶尖闭源模型相当。

幻方量化在论文中强调,通过优化算法、框架和硬件,DeepSeek-V3的训练成本极低。假设H800GPU租用价格为每块GPU2美元/小时,DeepSeek-V3的全部训练成本仅为557.6万美元。

此外,DeepSeek-V3的API服务定价也进行了调整,每百万输入tokens价格为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens价格为8元。相比之下,同类型模型如OpenAI的GPT 4o定价较高。

(文章来源:财联社)