DeepSeek引领AI大模型创新潮流，Grok3等劲敌纷至沓来

股市热点 2025-02-19 18:01:49 来源：上观新闻作者：网络

AI导读：

DeepSeek发布大招引发全球大模型产业震动，Grok3等模型相继问世，行业创新重点转移，价格战打响。MiniMax、商汤科技等国内大模型企业积极应对，推动AI普及。

算算，距离深度求索公司Deepseek发布大招已经过去了30天。

“DeepSeek-R1性能对标OpenAI GPT-4正式版+开源模型权重+网页版和App免费可用+API每百万tokens输入只要1块钱+论文训练技术全部公开”，1月20日的这套“组合拳”，让全球大模型产业为之震动。上海稀宇科技有限公司，即知名MiniMax，其副总裁刘华认为，大模型仍处于快速发展阶段，保持着每隔几个月就会取得重要突破的迭代频率。

北京时间2月18日，埃隆·马斯克旗下的人工智能公司xAI发布新一代AI模型Grok3，号称“地球上最聪明的AI”。这30天里，大模型领域可谓风起云涌，但有一点谁都承认，大模型的影响力显著增强。如今，新兴模型已不必再与GPT系列比肩，而是开始与DeepSeek等后起之秀一较高下。

再过两天，以“模塑全球，无限可能”为核心主题的2025全球开发者先锋大会，将在徐汇西岸举行。本文试图用尽可能通俗的语言，梳理这一个月内，国内外，特别是上海的大模型企业都在做什么。

大模型独角兽被“抢头条”

作为大模型独角兽的两家上海AI企业阶跃星辰和MiniMax，都在各自产品中引入了DeepSeek。这两家企业的主攻方向是多模态，并未与DeepSeek构成强竞争关系。

若是没有Grok3“搅局”，18日的“大模型日报”头版头条，本该属于阶跃星辰。这家被《麻省理工科技评论》点名的中国AI企业，当天联合吉利汽车集团，开源了两款多模态大模型：全球范围内参数量最大的开源视频生成模型Step-Video-T2V，以及行业内首款产品级开源语音交互大模型Step-Audio。

和DeepSeek R1一样，阶跃星辰的Step-Video-T2V视频生成模型也采用MIT许可协议，支持免费商用、任意修改和衍生开发。阶跃星辰创始人、CEO姜大昕博士表示，这次发布意味着阶跃星辰成为大模型开源世界的又一股中国力量。

相比之下，连续两个月保持全球AI视频产品榜首位的MiniMax“官宣动作”少了些，仅在1月20日宣布全新升级T2A-01系列语音模型，全球同步上线海螺语音产品。不过，2025年以来，MiniMax十分活跃，曾在十天内连发四个AI模型，包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01，以及视频模型S2V-01、语音模型T2A-01。

“最聪明”还得是靠“我有钱”

再来聊聊抢了阶跃星辰头条的Grok3吧，这款在“诞生”前就被描述为“地球上最聪明的AI”的模型。

在昨天的发布会上，Grok3的表现名副其实，在数学推理、科学逻辑推理和代码写作等方面的能力，在多项基准测试中均取得了比DeepSeek-V3、GPT-4o和Gemini-2 pro更优的成绩。

在全球知名AI模型评测平台Chatbot Arena中，Grok3版本的得分达到1402分，超过了包括GPT-4o、DeepSeek-R1等在内的所有其他模型。

在发布会演示过程中，马斯克及其团队成员展示了Grok3的信息收集和推理能力，以及创意能力。Grok3由10万个以上的英伟达H100 GPU驱动，提供了超过2亿GPU小时的计算资源。它不是开源模型，且需要付费。

马斯克的xAI无疑成为国际AI大模型的强有力竞争者。除了国内大模型企业外，OpenAI、谷歌、Anthropic等也是劲敌。2025年前两个月，全球大模型玩家仿佛集体“冲业绩”——

OpenAI近日宣布，将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。OpenAI首席执行官山姆·奥特曼18日在社交平台表示，GPT-4.5的试用体验远超预期。这是GPT-4.5离正式发布不远的信号。

本月初，谷歌更新了Gemini2.0“全家桶”，包括通用模型Gemini 2.0 Flash、谷歌最强的模型Gemini 2.0 Pro，以及“性价比最高”的模型Gemini 2.0 Flash-Lite。谷歌宣称，Gemini 2.0 Pro比以往任何Gemini模型具有更好的世界知识理解和推理能力。

发布新应用开发框架

拥有自研大模型的上市公司商汤科技，主要通过MaaS（模型即服务）模式提供DeepSeek模型服务。

近30天里，商汤的“官宣”吸睛有限：1月20日，日日新融合大模型交互版（SenseNova-5o）正式提供实时音视频对话服务，限时免费；26日，宣布SenseNova-5o在实时音视频中文测评基准SuperCLUE-Live首测榜单中以总分68.59排名国内第一；2月8日，商汤大装置上架DeepSeek系列模型，提供3个月内1000万tokens免费使用权益。

2025年，AI Agent有望成为最重要的产品形态。商汤科技将在2025全球开发者先锋大会上发布面向开发者的一站式开源Agent应用开发框架——LazyLLM。

LazyLLM利用轻量网关实现分布式应用一键部署。举例来说，若要开发一款多模态客服问答机器人，传统方法可能需要开发者花费一周时间进行模型微调、串联功能，才能形成完整的Agent应用。而通过LazyLLM，可通过低代码快速实现功能，让开发更加高效。

另据透露，商汤科技还将在本次大会上发布“代码小浣熊”2.0版本，为开发者和企业用户提供更强大的AI支持。

随着DeepSeek爆火，更多人尝试使用AI，这对AI生态和产业发展无疑是利好消息。行业创新的重点是否要转移到应用？“价格战”怎么打？对于AGI来说，多模态有多重要？这些问号都等待着被拉直。

MiniMax副总裁刘华对“撞墙论”嗤之以鼻，他认为，未来两到三年，Transformer架构变化的算法创新、合成数据、强化学习、多模态融合等，都将为模型能力带来几倍量级提升的技术空间。

DeepSeek团队昨天发布的一篇新论文，第一位作者是实习期间完成研究的年轻人。MiniMax的研发团队也非常年轻，大部分是35岁以下的“90后”。

在DeepSeek的推动下，大模型正朝着越来越智能且免费的方向发展，这将加快大模型普及的步伐。

（文章来源：上观新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。