AI导读:

DeepSeek大模型火爆后,国内芯片厂商迅速反应,多家国产AI芯片宣布完成适配。无问芯穹CEO夏立雪表示,DeepSeek并未减少算力需求,反而凸显了算力高效利用的重要性。同时,DeepSeek为国产芯片带来软硬件联合优化的机遇,异构算力平台商业模式已见曙光。

  新华财经上海2月20日电(记者杜康)今年以来,国产人工智能大模型Deepseek大热。前不久,《麻省理工科技评论》一篇题为《关注DeepSeek之外的四家中国人工智能初创公司》的文章引发关注,无问芯穹便是文中列举的四家初创公司之一,专注于异构算力。虽然成立不满两年,无问芯穹已经吸引了近10亿元融资。

  DeepSeek火爆之后,行业探讨的一个焦点是,这将会如何影响国产算力?可以看到,DeepSeek出圈后,国内的芯片厂商反应迅速,华为昇腾、海光信息、沐曦、天数智能、摩尔线程、壁仞等多家国产AI芯片宣布完成适配DeepSeek模型。记者近日专访了无问芯穹CEO夏立雪,聚焦当前市场对于国产算力的三大关切点。

  一问:DeepSeek的低成本,是否意味着对算力需求变低?

  从DeepSeek正式发布的技术报告来看,R1的基础模型V3总训练成本仅为557万美元。相较之下,GPT-4o这样的模型训练成本约为1亿美元。这意味着DeepSeek的成本只有GPT-4o的1/20。低成本实现的背后,是DeepSeek对于算力的高效利用。

  夏立雪表示,DeepSeek的火爆并未减少算力需求,反而凸显了算力高效利用的重要性,规模扩大依然是性能提升的基础。

  事实上,DeepSeek出来之后,美国的大厂并没有削减其算力开支,反而以更大、更激进的投入卷“算力”。

  2月18日,埃隆·马斯克发布其最新一代大模型Gork3,宣称使用了20万块H100 GPU,据估算这一成本相当于DeepSeek模型的200多倍。

  从公开数据来看,2025年美国科技四巨头资本支出仍将高速增长。这预示着未来算力市场将持续扩大。

  夏立雪提到,未来关于算力的需求结构会发生变化,推理算力的需求会急剧增加。

  二问:DeepSeek的火爆,为国产芯片带来哪些机会?

  “对于国产芯片来说,DeepSeek证明了软硬件联合优化技术路径的可行性。”夏立雪说。DeepSeek的突破为国产芯片注入了一剂“强心针”,有望通过软硬件协同优化缩小与海外芯片的差距。

  走通软硬件协同的路径,需要关注模型、系统、芯片三个关键因素。海外已形成闭环生态,而国产芯片正迎来打造自主算力生态的机遇。

  “DeepSeek的突破激发了越来越多的下游应用创造力,不仅将激发国产芯片的市场需求,也为打造全国产AI产业闭环创造了有力条件。”

  夏立雪提出了国产芯片“三步走”的发展思路,旨在实现“国产模型-国产芯片-国产系统”的全国产AI产业闭环。

  三问:国产算力的“异构”模式,商业路径走通了吗?

  “我们希望让算力使用起来像水、电、煤一样便捷。”夏立雪这样描述无问芯穹的愿景。无问芯穹希望通过异构云,扩大国内大模型产业可用算力的范围,提升算力利用效率。

  前不久的2月11日,无问芯穹宣布获七家国产芯片支持,成为首个同时支持DeepSeek多芯片适配和推理的平台。随着技术的逐渐成熟和上下游生态的共同努力,异构算力平台的商业模式已见曙光。

  “在某些特定场景下,使用国产芯片或异构芯片已被验证性价比能超过英伟达。随着DeepSeek激发下游应用创造力,更多厂商将尝试这种方式。”夏立雪说。

(文章来源:新华财经)