国内大厂接连开源大模型,AI领域竞争再升级
AI导读:
国内大模型厂商接连开源,阿里云、小米、DeepSeek等巨头相继发布新一代开源模型,性能卓越,引发AI领域广泛关注。大厂布局各异,AI领域竞争激烈,未来谁将留在牌桌上成为焦点。
赶在五一假期前,国内大模型厂商接连开源。4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为Deepseek-R1的1/3,成本大幅下降,性能全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型,并迅速成为全球最强开源模型。随后在4月30日,小米开源首个为推理而生的大模型Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。4月30日晚,Deepseek也在开源社区Hugging Face上正式发布DeepSeek-Prover-V2,并同步上线模型卡及示例代码。
两天内3家巨头大模型宣布开源,AI领域再掀波澜
Qwen3包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,阿里云开源了两个 MoE 模型的权重,六个密集模型也已开源,每款模型均斩获同尺寸开源模型SOTA(最佳性能),其中千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能。

据悉,阿里云此次开源的千问3是国内首个“混合推理模型”,即将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,这样能大大节省算力消耗。在阿里巴巴千问3开源后,上下游供应链连夜进行适配和调用,NVIDIA、高通、联发科、AMD等多家头部芯片厂商已成功适配千问3。
阿里云今年已持续开源了通义万相首尾帧生视频14B模型、首个端到端全模态大模型通义千问Qwen2.5-Omni-7B、阿里万相2.1模型、视觉理解模型Qwen2.5-VL等模型。对于阿里云的持续开源策略,知名数字经济学者、工信部信息通信经济专家委员会委员盘和林表示,阿里云的开源逻辑很简单,阿里云的模型是开源、免费的,但阿里云的硬件比如算力、各类软件工具、容器是不免费的,开源模型要和自己的数据结合形成自己的AI,阿里云以模型开源来切入AI应用并在别的方面实现盈利,开源对阿里整个云服务生态是有利的。
4月30日,小米官方表示,其最新开源的Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini。这是小米首次对外开源其模型,据悉,MiMo来自小米内部刚成立不久的“小米大模型Core团队”。

4月30日晚,DeepSeek正式发布DeepSeek-Prover-V2的两个参数模型,并同步开源、上线模型卡及示例代码。其中此次共推出两个版本DeepSeek-Prover-V2-7B基于上一代 V1.5 模型,支持最长32K上下文输入;DeepSeek-Prover-V2-671B则在DeepSeek-V3-Base基础上训练达到了推理性能最强。新模型主要专注数学定理证明,大幅刷新了多项高难基准测试。
浙江大学计算机科学与技术学院副教授金小刚表示,开源不是目的,其实是手段,不同的企业为了配合企业战略可采取了不同的合作策略。其中,对阿里还是有期待的,期待中国企业在开源中借助于群体智能,形成技术优势,深化场景应用。
在开源生态上,零一万物CEO、创新工场董事长李开复表示,阿里通义千问Qwen、DeepSeek等中国自研顶尖开源模型给全世界带来了巨大撼动,也展示了中国AI探索出了模型训练自主创新的“第二路径”。他强调,Qwen3一经发布就成为了开源模型中的SOTA(行业最优水平)存在,再次强调了开源模型的竞争力的同时,也为坚持只走闭源路线的硅谷巨头敲响警钟。
大厂布局各异,AI领域竞争激烈
在大模型时代,互联网大厂正在遵循各自的优势进行布局。其中,阿里通过加大资金和人才投入,以云计算网络作为底层,以通义大模型为底座,在C端应用上则布局了夸克和钉钉;百度也在以B端布局智能云、C端布局AI搜索,应用方面布局秒哒、心响、文库等;字节则主要以火山引擎布局云计算,并押注了全域的多个模型应用;腾讯方面,汤道生表示,用户需求是腾讯大模型的出发点,腾讯将以“核心技术自研+积极拥抱开源”的多模型策略打造“好用的AI”。
在这一轮AI竞争中,谁能留在“牌桌”上?李开复预测中国大模型领域未来将会收敛至 DeepSeek、阿里巴巴、字节跳动三家,其中以 DeepSeek 势头最猛。他还特别提到阿里、字节和DeepSeek各自的优势,认为阿里和字节跳动具备巨大的用户量和商业化空间来支撑超大模型的训练。
盘和林则认为,“字节如今在牌桌上优势最大,因为用户大多数是内容创作者,生成式也是当前AI最大的需求场景;腾讯则借助微信的用户流量,未来以移动应用工具为主;阿里背靠阿里云以开源打造AI生态,以阿里云服务来变现;至于百度,主要是将AI和搜索效果结合起来。这里面,我认为阿里最激进,字节用户普及度较高,预计都能留在牌桌上。”
(文章来源:南方都市报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。