AI导读:

国产开源大模型DeepSeek凭借出色性价比成为全球增速最快的AI应用,引发算力市场巨震。AI芯片巨头英伟达、AMD、英特尔等纷纷宣布支持,国产GPU厂商、云计算厂商也积极适配。DeepSeek的崛起展示了AI产业向高效化发展的趋势。

国产开源大模型DeepSeek凭借其卓越的性价比,已成为全球增速最快的AI应用,这一成就不仅引发了全球科技界的热烈讨论,更对算力信仰产生了深远的影响,同时极大地增强了构建开放型人工智能生态的信心。DeepSeek的崛起,不仅吸引了英伟达、AMD、英特尔等国际芯片巨头的关注,他们纷纷宣布集成DeepSeek模型并提供算力支持,而且国产GPU厂商、云计算厂商以及应用厂商等AI产业链上的合作伙伴也迅速响应,积极调用DeepSeek,以升级各自的产品和技术。

算力市场迎来巨震

作为幻方量化旗下AI公司深度求索研发的国产开源大模型,DeepSeek近期发布的DeepSeek-V3、DeepSeek-R1等AI模型展现出了令人瞩目的效果。其中,DeepSeek-V3在多语言编程测试排行榜中紧随OpenAI的GPT-4之后,更在数学能力上超越了所有开源和闭源模型。而其训练成本仅为557.6万美元,远低于GPT-4等模型高达数亿美元的训练成本。移动应用分析机构SensorTower的数据显示,DeepSeek应用软件在短短18天内下载量即达1600万次,截至2025年2月4日,其日活用户数已突破2000万大关,成为全球增速最快的AI应用。

人工智能行业的专家指出,DeepSeek的成功证明了即使不依赖堆叠算力,也能打造出优秀的大模型。DeepSeek通过引入高效的模型蒸馏技术,成功将大规模模型的能力迁移至更小、更高效的版本。同时,借助Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术,显著降低了显存占用,优化了模型性能。

TrendForce集邦咨询的研究指出,DeepSeek采用的蒸馏模型技术,有效压缩了大型模型,提升了推理速度,降低了硬件需求,并充分发挥了英伟达Hopper降规版芯片的效益,实现了运算资源的最大化利用。DeepSeek的成本优势来源于其高效能硬件选择、新型蒸馏技术以及API开源策略,这不仅优化了技术与商业应用的平衡,也展示了AI产业向高效化发展的趋势。

DeepSeek的崛起,对算力市场产生了巨大的冲击。全球算力巨头英伟达股价在1月27日一度暴跌近17%,之后虽逐步企稳,但影响深远。同时,A股光通讯模块龙头中际旭创也在1月27日下跌约10%,2月5日进一步放量下跌;工业富联下跌6.76%,寒武纪-U更是下跌了12.46%。然而,英伟达对此表示,DeepSeek的进展显示了其芯片在中国市场的实用价值,并预计未来为满足DeepSeek的服务需求,还将需要更多英伟达芯片。

此外,全球数据中心建设仍在持续推进,DeepSeek模型虽降低了AI训练成本,但AI模型的低成本化有望扩大应用场景,进而增加全球数据中心的建设量。TrendForce集邦咨询预测,随着高速数据传输需求的增长,2023年400Gbps以上的光收发模块全球出货量将达到640万个,2024年约2040万个,至2025年预计将超过3190万个,年增长率高达56.5%。

AI芯片积极适配DeepSeek

DeepSeek的认可度不仅体现在排行榜和用户下载量上,更反映在国际AI芯片巨头的兼容和本土厂商的积极适配上。1月31日,英伟达发布了搭载DeepSeekR1671b的“英伟达NIM微服务”预览版,显著提升了AI模型的运行效率,简化了企业部署流程,降低了AI落地的技术门槛。同时,AMD已将新的DeepSeek-V3模型集成到InstinctMI300XGPU上;英特尔也表示其开发的AI芯片/GPU芯片可以支持DeepSeek,有意与中国芯片企业合作打破英伟达打造的生态垄断。

业内分析指出,虽然DeepSeek并未完全脱离英伟达的CUDA生态,但通过使用英伟达的PTX语言,DeepSeek实现了在接近汇编语言的层级运行,能够进行细粒度的优化,对GPU硬件进行更底层、更精准的控制,从而将英伟达H800GPU的性能发挥到极致,实现了传统基于CUDA的方法难以达到的效率提升。这一技术突破不仅有利于DeepSeek自身的发展,也对国产GPU企业产生了积极影响。通过精通运用PTX语言,有望帮助国产GPU进行针对性算子优化,提升模型在国产GPU上的运行效率。

除了国际巨头,国产AI芯片企业海光信息也宣布成功完成DeepSeekV3和R1模型与海光AI加速卡DCU的适配并正式上线,这将有助于推动AI技术在更多行业的落地与普及。同时,潞晨科技携手华为昇腾,联合发布了基于昇腾算力的DeepSeekR1系列推理API及云镜像服务,实现了昇腾算力与DeepSeekR1系列模型的推理适配优化。此外,国产GPU厂商沐曦、摩尔线程、天数智芯以及壁仞科技等也纷纷宣布与DeepSeek展开合作,共同推动AI技术的发展。

云计算巨头积极拥抱DeepSeek

除了AI硬件端厂商外,云计算巨头也纷纷加入DeepSeek的“朋友圈”。华为云、腾讯云、阿里云、百度云等已经宣布支持部署DeepSeek模型。同时,联通云也宣布已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型,提供全方位运行服务保障,为客户带来开箱即用的使用体验。此外,应用端厂商也在积极探索和部署DeepSeek模型,如万兴科技、北信源、奇安信、当虹科技以及易点天下等,他们纷纷将DeepSeek的AI能力融入自身产品中,以提升用户体验和降低运营成本。

(文章来源:证券时报·e公司 未经授权不得转载)