阿里新一代通义千问模型Qwen3发布,AI领域再掀波澜
AI导读:
阿里巴巴在“五一”节前开源新一代通义千问模型Qwen3,引发业界关注。Qwen3是中国公司推出的首个混合推理模型,性能超越上一代,但并未全面碾压DeepSeek R1。千问3系列中的小参数量模型表现突出,为即将到来的智能体Agent和大模型应用爆发提供了更好支持。
《科创板日报》5月1日讯(记者黄心怡)阿里巴巴在“五一”节前开源新一代通义千问模型Qwen3,且一次性开源了8个版本,引发业界广泛关注。
阿里千问大模型官网用“思深,行速”来描述Qwen3,称其为中国公司推出的首个混合推理模型,融合了“推理”和“非推理”模式,可根据不同问题选择“快、慢思考”。
最新数据显示,阿里Qwen系列大模型累计下载量已达3亿次,衍生模型数量超10万个,位居全球第一。Qwen3的发布吸引了众多开发者使用和测评。
Qwen3提供了多种参数的模型版本,包括2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。阿里方面表示,千问3的30B参数MoE模型仅激活3B就能达到上代Qwen2.5-32B模型性能,而32B版本的千问3模型性能超越上一代Qwen2.5-72B。
多名开发者表示,千问3系列中的小参数量模型表现突出,32B模型性价比最高,235B相比千问2.5提升不太大。有业内人士推测,千问3发力小参数模型,主要是为了苹果生态而准备。
此前,阿里董事局主席蔡崇信回应了阿里与苹果在手机上合作落地AI的传闻。今年4月消息称,苹果计划于2025年中期前在国行iPhone上引入AI功能。
▍并非全面碾压Deepseek R1
尽管Qwen3发布后,有媒体报道其性能全面碾压DeepSeek R1,但《科创板日报》记者注意到,各家公司公布的大模型测评数据指标不一,因此比较中立的第三方测评更具说服力。
著名华裔AI学者吴恩达的公司Artificial Analysis测试显示,Qwen3在某些指标上超越DeepSeek R1,但并非全面碾压。
在多项测试中,Qwen3 235B与DeepSeek R1成绩接近或各有优劣,业内普遍认为,Qwen3推理模型整体表现略好于R1,但相比R1并无太大突破。
▍小参数模型远超预期
另一名开发者表示,千问3系列的超大参数模型不及预期,但小参数模型远超预期,4B模型在数学能力上表现惊艳。
小参数量模型主要用于端侧部署,如4B模型可用于手机端,8B可用于电脑和汽车端侧,32B可用于企业大规模部署。
开放传神(OpenCSG)联合创始人陈冉认为,通义大模型的出现验证了数据沉淀的重要性,再次证明开源是技术创新的基石。
随着千问3的发布,上下游供应链第一时间进行适配和调用,英伟达、英特尔、联发科、AMD等多家头部芯片厂商纷纷适配千问3。
英特尔在车端舱内对新发布的千问3系列模型已完成匹配,国产芯片厂商海光信息则宣布其DCU完成对Qwen3全部8款模型的适配+调优。
业内分析认为,千问3为即将到来的智能体Agent和大模型应用爆发提供了更好支持。阿里云智能集团副总裁霍嘉表示,模型推理能力不断提高,今年将是AI应用爆发的元年。
▍通用Agent面临挑战
华创证券评价千问3大模型时称,Agent训练与落地成为AI+叙事的下一重心。天风证券认为,AI Agent市场规模有望超万亿,通义千问有望成为B端Agent链主。
在第八届数字中国建设峰会期间,中国一汽正式发布基于阿里通义大模型打造的企业智能体OpenMind,成为汽车行业首个面向全集团运营管理的AI Agent。
中国电信、蚂蚁集团等也纷纷发布智能体相关平台,加速AI Agent在政务、金融等领域落地。
然而,通用Agent在工程和技术模型方面仍面临挑战,能够处理通用或复杂任务的产品并不多。
阿里云CTO和通义实验室负责人周靖人表示,今年大模型领域将主要在类人思考和多模态上提升,同时与底层云计算系统更深度结合,提升训练和推理效率。
在谈及竞争对手时,周靖人认为市场空间很大,欢迎共同推动AI产业发展,谁领先还需看市场反馈。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。