AI大模型迭代加速,xAI发布Grok 3引领行业变革
AI导读:
知名企业家马斯克与xAI团队发布最新版大模型Grok 3,引发行业关注。中国初创企业DeepSeek也推出新版大模型,大模型迭代升级加速。同时,谷歌、OpenAI等公司相继宣布将发布新版大模型,市场竞争愈发激烈。
近期,AI大模型的迭代速度持续加快。北京时间2月18日,知名企业家埃隆·马斯克(Elon Musk)携手xAI团队在X平台上直播,发布了xAI团队最新研发的大模型Grok 3。马斯克称赞该模型为“地球上最聪明的AI”。据悉,xAI团队为训练Grok 3,将数据中心GPU数量从10万张扩充至20万张。
2月初,中国初创企业Deepseek推出了新版大模型DeepSeek-R1,凭借其极低的训练和使用成本,在大模型领域引发了不小的震动。随后,谷歌、xAI、OpenAI、Anthropic等公司也相继宣布将推出新版大模型,并有更多公司表示将采取开源策略。机构分析认为,大模型的开源将显著降低应用成本,为AI应用带来新的发展机遇。
大模型迭代持续升级
对于新发布的大模型Grok 3,马斯克在直播中表示:“Grok 3的性能较Grok 2有了显著提升,与Grok 3交流将变得非常有趣。”2023年7月,马斯克成立了xAI公司。同年11月,xAI发布了第一款大模型Grok 1,该模型拥有3140亿参数,成为当时参数量最大的开源大语言模型。2024年8月,xAI发布了Grok 2,业内专家表示,该模型在性能上与ChatGPT的新模型不相上下。
为了打造更强大的Grok 3,马斯克与xAI团队成员表示,在训练过程中,团队搭建了大型算力集群,并成功克服了散热、电力等问题带来的挑战。第一阶段,团队仅用122天就将首批10万张GPU投入使用,随后又用92天将集群规模扩大一倍,GPU数量增至20万张。
xAI团队在直播中展示称,Grok 3和Grok 3mini在多项测试中得分均超过或媲美Gemini、DeepSeek和ChatGPT等竞争对手。团队还演示了用Grok 3生成代码,通过运行这段代码,画面上呈现出了飞船在地球和火星间往返的动画。此外,xAI团队还用Grok 3制作了一款类似于俄罗斯方块的游戏。
此外,xAI还宣布推出名为DeepSearch的Grok 3智能搜索引擎。xAI团队表示,Grok 3的所有功能将在一周后陆续上线,并将开源上一代模型Grok 2。开源证券指出,全球AI领域近期取得了多项重大进展,这些突破有望加速AI应用的普及。
市场竞争愈发激烈
马斯克的xAI已成为大模型领域的强劲竞争者,与其同台竞技的还有DeepSeek、OpenAI、谷歌等企业。
近期,中国初创企业DeepSeek发布了开源推理大模型DeepSeek-R1,该模型以极低的成本实现了高性能表现,超越了部分对标模型,搅动了大模型市场的格局。公开资料显示,DeepSeek-V3使用了2048张英伟达H800 GPU训练了两个月,训练成本为557.6万美元,仅为GPT-4o的十分之一。
DeepSeek新模型发布后,2月初,谷歌发布了Gemini2.0系列模型,该系列模型强化了编码与推理能力,并向所有用户开放使用。OpenAI则于近日宣布,公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。据称,GPT-5将整合OpenAI的多项核心技术,包括o3推理模型。另有消息称,Anthropic计划在未来几周内发布新的混合型大模型Claude 4,用户可以自行控制使用时的推理成本。
同时,DeepSeek还掀起了大模型领域的开源革命,推动大模型成为各领域的“水电煤”。2月18日,阶跃星辰宣布与吉利汽车集团联合开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。百度宣布,其大模型产品文心一言将于4月1日起全面免费,所有PC端和App端用户均可体验其最新模型。2月13日凌晨,OpenAI也宣布免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。
中国信息通信研究院技术与标准研究所工程师龚正指出,AI技术的成熟正在改写商业模式,DeepSeek等开源模型的崛起正在重构行业生态。
产业链将迎来重塑
截至中国证券报记者发稿时,据不完全统计,已有数百家公司和机构正式接入DeepSeek研发的大模型,涵盖芯片、云服务、网络科技、金融、汽车等多个行业。
日前,DeepSeek接入了拥有近14亿用户的微信。微信自2月15日起开始灰度测试接入DeepSeek-R1模型,以增强其搜索功能。2月16日晚间,百度搜索宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能。
一位关注AI创新的投资服务业人士表示,未来大模型企业可以通过向企业端提供解决方案获得收益。对于大模型企业来说,未来的估值将不再单纯依赖于模型本身,投资者将更多地关注其生态建设、用户规模、数据质量以及增值服务的盈利能力。
AI大模型的应用已经渗透到内容创作、金融、电信、自动驾驶等领域。国信证券指出,三大运营商年后陆续接入DeepSeek,运营商庞大的数据有助于为DeepSeek的模型训练与优化提供丰富素材,运营商接入DeepSeek有助于开发新的AI驱动型业务,运营商云平台有望实现AI能力深度集成,加速云业务增长。
在内容创作领域,AI大模型可以帮助企业快速生成文案、图片、视频等内容,提高创作效率。阅文集团近日宣布,旗下作家辅助创作产品“作家助手”应用已集成独立部署的DeepSeek-R1大模型。数字文化内容产业集团中文在线也宣布,公司已在部分内部AI网文创作流程中部署DeepSeek-R1,以增强创作效率。
在智能客服领域,AI大模型可以实现更智能的交互,提升客户满意度。一汽丰田汽车销售有限公司近日宣布已借助腾讯云的大模型知识引擎接入DeepSeek模型,在智能客服等业务场景深度应用,大幅提升在线智能客服、电话外呼、系统运维工单等多场景的服务效率和用户体验。
在金融领域,AI大模型可用于风险评估、投资决策等,提高金融机构的运营效率和风险管理能力。例如,国金证券表示,将把DeepSeek应用于信息检索、文档处理、行业研究及市场分析等多个场景,未来还计划进一步拓展至智能服务、风险管理、投资分析等核心业务领域。
清华大学公共管理学院教授、清华大学人工智能国际治理研究院副院长梁正近期在接受采访时表示,AI未来的发展将向终端化与轻量化发展,随着多模态、强化学习等技术进步,服务机器人、无人驾驶车辆、无人机的规模化部署将成为可能。
交银国际发布研报称,看好垂类大模型在办公、零售、客服、金融、营销、教育、文娱等领域的场景落地,以及云服务提供商BAT(百度、阿里巴巴、腾讯)价值重估的机会。摩根资产管理表示,将关注以人工智能为驱动力的科技产业、新能源产业、高端制造业以及以创新药为主的医疗健康产业。
(文章来源:中国证券报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。