AI导读:

阿里通义千问大模型团队推出最新推理模型QwQ-32B,性能卓越,可媲美DeepSeek-R1,大幅降低部署成本。阿里巴巴股票因此受到市场关注,港股大幅高开,美股亦大涨。阿里在AI领域持续发力,相关成果有望加速迭代,带动算力需求爆发。



3月6日,阿里通义千问大模型团队宣布推出最新推理模型QwQ-32B,该模型拥有320亿参数,性能卓越,可媲美6710亿参数的Deepseek-R1模型,尽管二者参数量相差近20倍。

通过大规模强化学习,QwQ-32B在数学、代码及通用能力上实现显著提升,整体性能与DeepSeek-R1相当,同时大幅降低部署成本,实现消费级显卡的本地部署,展现高效能低成本优势。阿里巴巴股票(09988.HK)因此受到市场关注。

在数学推理、编程能力及通用能力测试中,QwQ-32B表现与DeepSeek-R1相当,远超OpenAI的o1-mini及相同尺寸的R1蒸馏模型。

阿里通义团队针对数学和编程任务、通用能力进行了两轮大规模强化学习,通过校验答案正确性和代码执行结果提供反馈,提升模型性能。

业内人士指出,QwQ-32B的成功表明,强大基础模型与大规模强化学习结合,能在较小参数规模下实现卓越性能,为通用人工智能发展提供新路径。

DeepSeek-R1虽拥有6710亿参数,但采用MoE架构和MLA方法,每次推理仅激活370亿参数,实现资源高效利用。阿里通义团队将继续探索智能体与强化学习集成,以实现更高智能。

阿里已将QwQ-32B模型向全球开源,采用Apache2.0协议,所有人可免费下载及商用,也可通过阿里云平台调用API服务,加速AI应用落地。

3月6日,阿里巴巴港股大幅高开涨超6%,收盘涨超8%;美股亦大涨超8%。此前,阿里发布QwQ-Max-Preview预览版,支持联网搜索,展现思考过程。

长江证券研报指出,阿里在AI领域持续发力,践行AI驱动战略,随着投入增加,相关成果有望加速迭代,惠及相关产业链,带动算力需求爆发,引领中国AI产业发展。

(文章来源:每日经济新闻)