阿里新一代通义千问模型Qwen3发布，AI领域再掀波澜

股市热点 2025-05-01 19:40:35 来源：财联社作者：网络

AI导读：

阿里巴巴在“五一”节前开源新一代通义千问模型Qwen3，引发业界关注。Qwen3是中国公司推出的首个混合推理模型，性能超越上一代，但并未全面碾压DeepSeek R1。千问3系列中的小参数量模型表现突出，为即将到来的智能体Agent和大模型应用爆发提供了更好支持。

《科创板日报》5月1日讯（记者黄心怡）阿里巴巴在“五一”节前开源新一代通义千问模型Qwen3，且一次性开源了8个版本，引发业界广泛关注。

阿里千问大模型官网用“思深，行速”来描述Qwen3，称其为中国公司推出的首个混合推理模型，融合了“推理”和“非推理”模式，可根据不同问题选择“快、慢思考”。

最新数据显示，阿里Qwen系列大模型累计下载量已达3亿次，衍生模型数量超10万个，位居全球第一。Qwen3的发布吸引了众多开发者使用和测评。

Qwen3提供了多种参数的模型版本，包括2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。阿里方面表示，千问3的30B参数MoE模型仅激活3B就能达到上代Qwen2.5-32B模型性能，而32B版本的千问3模型性能超越上一代Qwen2.5-72B。

多名开发者表示，千问3系列中的小参数量模型表现突出，32B模型性价比最高，235B相比千问2.5提升不太大。有业内人士推测，千问3发力小参数模型，主要是为了苹果生态而准备。

此前，阿里董事局主席蔡崇信回应了阿里与苹果在手机上合作落地AI的传闻。今年4月消息称，苹果计划于2025年中期前在国行iPhone上引入AI功能。

▍并非全面碾压Deepseek R1

尽管Qwen3发布后，有媒体报道其性能全面碾压DeepSeek R1，但《科创板日报》记者注意到，各家公司公布的大模型测评数据指标不一，因此比较中立的第三方测评更具说服力。

著名华裔AI学者吴恩达的公司Artificial Analysis测试显示，Qwen3在某些指标上超越DeepSeek R1，但并非全面碾压。

在多项测试中，Qwen3 235B与DeepSeek R1成绩接近或各有优劣，业内普遍认为，Qwen3推理模型整体表现略好于R1，但相比R1并无太大突破。

▍小参数模型远超预期

另一名开发者表示，千问3系列的超大参数模型不及预期，但小参数模型远超预期，4B模型在数学能力上表现惊艳。

小参数量模型主要用于端侧部署，如4B模型可用于手机端，8B可用于电脑和汽车端侧，32B可用于企业大规模部署。

开放传神（OpenCSG）联合创始人陈冉认为，通义大模型的出现验证了数据沉淀的重要性，再次证明开源是技术创新的基石。

随着千问3的发布，上下游供应链第一时间进行适配和调用，英伟达、英特尔、联发科、AMD等多家头部芯片厂商纷纷适配千问3。

英特尔在车端舱内对新发布的千问3系列模型已完成匹配，国产芯片厂商海光信息则宣布其DCU完成对Qwen3全部8款模型的适配+调优。

业内分析认为，千问3为即将到来的智能体Agent和大模型应用爆发提供了更好支持。阿里云智能集团副总裁霍嘉表示，模型推理能力不断提高，今年将是AI应用爆发的元年。

▍通用Agent面临挑战

华创证券评价千问3大模型时称，Agent训练与落地成为AI+叙事的下一重心。天风证券认为，AI Agent市场规模有望超万亿，通义千问有望成为B端Agent链主。

在第八届数字中国建设峰会期间，中国一汽正式发布基于阿里通义大模型打造的企业智能体OpenMind，成为汽车行业首个面向全集团运营管理的AI Agent。

中国电信、蚂蚁集团等也纷纷发布智能体相关平台，加速AI Agent在政务、金融等领域落地。

然而，通用Agent在工程和技术模型方面仍面临挑战，能够处理通用或复杂任务的产品并不多。

阿里云CTO和通义实验室负责人周靖人表示，今年大模型领域将主要在类人思考和多模态上提升，同时与底层云计算系统更深度结合，提升训练和推理效率。

在谈及竞争对手时，周靖人认为市场空间很大，欢迎共同推动AI产业发展，谁领先还需看市场反馈。

（文章来源：财联社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。