中美AI大模型争霸：马斯克Grok3与DeepSeek谁更胜一筹？

股市热点 2025-02-21 17:07:42 来源：新京报作者：网络

AI导读：

2月18日，马斯克发布Grok3大模型，采用20万张英伟达H100芯片训练，展示卓越技术实力。同日，DeepSeek发布降低训练成本的论文。两者代表中美AI大模型路线的本质差异，谁将更胜一筹？Grok3虽宣称将开源，但目前为闭源，而DeepSeek持续开源赋能全球。

2月18日，创立xAI的埃隆·马斯克发布了号称“地球上最聪明AI”的Grok3大模型，展示了其超越o3-mini的技术实力。同日，Deepseek的梁文锋和Kimi的杨植麟分别发布论文，聚焦减少长文本计算量，提升训练效率。这凸显了中美AI大模型路线的本质差异：马斯克采用20万张英伟达H100芯片训练Grok3，体现“力大砖飞”的美式路径；而DeepSeek则追求降低训练成本，提升效率。

Grok3虽宣称将开源，但目前仍为闭源，而DeepSeek持续开源，赋能全球。昂贵先进的闭源模型与性价比较高的开源模型，谁将更胜一筹？

马斯克靠“力大砖飞”登顶大模型测评榜，英伟达股价随之“收复失地”。Grok3使用20万块英伟达H100芯片训练，刷新大模型界权威盲测榜单记录。其背后庞大的参数规模和训练数据量，再次证明了“Scaling Law”的有效性。

xAI建立的数据中心，显示了其对大型算力集群的重视。尽管马斯克未提及数据规模，但分析认为，这包括互联网和特斯拉工厂的数据。

另一方面，梁文锋和杨植麟聚焦AI降本增效，让大模型人人可用。DeepSeek推出的NSA机制，加快了推理速度，降低了预训练成本。Kimi也发表了类似论文，介绍MoBA机制，提高计算效率。

NSA和MoBA机制都强调可无缝集成到现有语言模型中，无需重新训练。DeepSeek的开源模式也对美国大模型发展产生影响，xAI随后宣布免费提供Grok3服务。

Grok3在对话中透露，其训练成本高昂，而DeepSeek则具有成本优势。AI的进步是全球共同努力的结果，中美都在其中发挥了重要作用。

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。