蚂蚁集团Ling团队挑战英伟达“算力霸权”,百灵系列模型引关注
AI导读:
蚂蚁集团Ling团队发表技术成果论文,开发出百灵系列开源混合专家模型,大幅降低计算成本,挑战英伟达的“算力霸权”。该模型计划应用于医疗、金融等领域,有望推动AI技术的普及和发展。
长久以来,英伟达凭借高性能芯片构筑起“算力霸权”,在AI(人工智能)模型训练领域占据主导地位。这一局面在Deepseek(深度求索)问世后遭遇冲击,如今蚂蚁集团的Ling团队又带来了新的挑战。
3月初,蚂蚁集团首席技术官何征宇带领的Ling团队发表了一篇技术成果论文。论文显示,该团队开发了两款百灵系列开源混合专家(MoE)模型Ling-Lite(总参数为16.8B)和Ling-Plus(总参数为290B)。相比之下,GPT-4.5总参数为1.8T,DeepSeek-R1总参数为671B。这一成果在金融、科技领域引起了广泛关注。
惊艳之处在于,Ling团队在模型预训练阶段使用较低规格的硬件系统,将计算成本降低了约20%,训练成本大幅降低,却取得了与使用高性能芯片相当的效果。这一突破对英伟达的“算力信仰”提出了质疑。
Hugging Face工程师Tiezhen Wang在社交媒体上表示,这是做空英伟达的又一理由。Toms Hardware发表评论称,蚂蚁集团的技术突破展现出中国正坚定地朝着技术独立方向迈进。
蚂蚁集团回应称,针对不同芯片持续调优,以降低AI应用成本,目前已取得一定进展,并逐步通过开源分享。这一举措有望推动AI技术的普及和发展。
计划应用于医疗等领域
蚂蚁集团Ling团队的技术成果论文已发表在预印本平台arXiv上。该团队认为,在推理服务高峰期,高性能资源面临短缺,而性能较低的加速器更易获得且单价更低。因此,他们开发了能在异构计算单元和分布式集群间切换的技术框架。
实验结果表明,参数规模为300B左右的混合专家模型可以在性能较低的设备上有效训练,并在性能上达到与同规模的其他模型相当的水平。这一成果在金融、医疗等领域具有广泛应用前景。
在英语和中文理解能力上,LingLite和Ling-Plus模型表现优异,在数学和代码基准测试方面也取得了不俗的成绩。此外,在工具使用方面,Ling-Plus和Ling-Lite在基准测试中均取得了最佳成绩。
据悉,蚂蚁百灵大模型LingPlus和Ling-Lite计划开源,并应用于医疗、金融等行业领域,这将进一步推动AI技术在这些领域的应用和发展。
打破“算力霸权”?
有分析称,百灵系列混合专家模型的推出标志着蚂蚁集团加入AI领域的竞赛。自DeepSeek展示出能够以远低于OpenAI和谷歌投入的成本训练出强大模型以来,这一竞争加速升级。
蚂蚁集团正在探索一条新的路径——在无高端GPU的情况下扩展模型训练能力。这一举措有望打破英伟达的“算力霸权”,推动AI技术的进一步发展和普及。
蚂蚁集团有关人士表示,在模型训练过程中,他们既使用了国产芯片,也采用了英伟达芯片。这一做法体现了中国在AI技术方面的开放和包容态度。
Toms Hardware发表评论称,蚂蚁集团此次技术突破清晰展现出中国正坚定地朝着技术独立方向迈进。彭博资深商业智能分析师同样指出,蚂蚁集团的研究展示了中国在AI创新方面的快速进步。
(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。