阿里通义千问推出QwQ-32B推理模型,阿里股票受关注
AI导读:
阿里通义千问大模型团队推出最新推理模型QwQ-32B,性能卓越,可媲美DeepSeek-R1,大幅降低部署成本。阿里巴巴股票因此受到市场关注,港股大幅高开,美股亦大涨。阿里在AI领域持续发力,相关成果有望加速迭代,带动算力需求爆发。
3月6日,阿里通义千问大模型团队宣布推出最新推理模型QwQ-32B,该模型拥有320亿参数,性能卓越,可媲美6710亿参数的Deepseek-R1模型,尽管二者参数量相差近20倍。
通过大规模强化学习,QwQ-32B在数学、代码及通用能力上实现显著提升,整体性能与DeepSeek-R1相当,同时大幅降低部署成本,实现消费级显卡的本地部署,展现高效能低成本优势。阿里巴巴股票(09988.HK)因此受到市场关注。
在数学推理、编程能力及通用能力测试中,QwQ-32B表现与DeepSeek-R1相当,远超OpenAI的o1-mini及相同尺寸的R1蒸馏模型。
阿里通义团队针对数学和编程任务、通用能力进行了两轮大规模强化学习,通过校验答案正确性和代码执行结果提供反馈,提升模型性能。
业内人士指出,QwQ-32B的成功表明,强大基础模型与大规模强化学习结合,能在较小参数规模下实现卓越性能,为通用人工智能发展提供新路径。
DeepSeek-R1虽拥有6710亿参数,但采用MoE架构和MLA方法,每次推理仅激活370亿参数,实现资源高效利用。阿里通义团队将继续探索智能体与强化学习集成,以实现更高智能。
阿里已将QwQ-32B模型向全球开源,采用Apache2.0协议,所有人可免费下载及商用,也可通过阿里云平台调用API服务,加速AI应用落地。
3月6日,阿里巴巴港股大幅高开涨超6%,收盘涨超8%;美股亦大涨超8%。此前,阿里发布QwQ-Max-Preview预览版,支持联网搜索,展现思考过程。
长江证券研报指出,阿里在AI领域持续发力,践行AI驱动战略,随着投入增加,相关成果有望加速迭代,惠及相关产业链,带动算力需求爆发,引领中国AI产业发展。
(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。