小米开源MiMo大模型,以“小博大”策略引领AI新风尚
AI导读:
小米宣布开源首个为推理而生的大模型Xiaomi MiMo,凭借70亿参数实现卓越性能,超越OpenAI和阿里模型。此举带动小米股价上涨,并标志着AI发展进入新阶段。小米全面发力AI大模型,致力于将大模型与自身业务深度协同。
小米进军大模型领域,以其擅长的“以小博大”策略引发关注。4月30日,小米宣布开源首个专为推理设计的大模型Xiaomi MiMo。值得注意的是,其MiMo-7B-RL模型仅凭借70亿参数,在多项权威基准测试中超越了OpenAI的o1-mini和阿里通义千问320亿参数的QwQ-32B-Preview,实现了小参数模型的卓越表现。
受这一消息影响,小米股价当日上涨5.37%,同时带动了金山云和金山软件的股价分别大涨14.20%和7.07%。业内人士指出,小米作为国产手机品牌领头羊,此次开源的小参数规模模型展现出强大性能,为AI在手机端侧的应用奠定了坚实基础。
小米开源MiMo推理大模型
小米在4月30日正式宣布开源Xiaomi MiMo大模型。该模型在数学推理和代码竞赛上,仅凭7B的参数规模,就超越了OpenAI的o1-mini和阿里Qwen更大规模的QwQ-32B-Preview模型。 通过预训练和后训练的创新算法组合,小米团队实现了这一卓越性能。
MiMo的技术细节包括使用改进的GRPO算法、移除KL损失、动态采样等策略,以及测试难度驱动的奖励机制等。小米大模型团队已公开MiMo的技术报告,并开源了MiMo-7B全系列模型。
小米大模型Core团队表示,MiMo是其初步尝试的成果。业内人士认为,MiMo的开源标志着AI发展进入注重算法效率和能力密度的新阶段,小模型同样能实现高效率和大智慧。
小米全面发力AI大模型
随着MiMo模型的开源,小米新成立的小米大模型Core团队也逐渐进入公众视野。自2016年组建AI团队以来,小米持续扩大AI团队规模,目前已达3000多人,涵盖视觉、语音、声学等多个领域。
小米在AI大模型领域的投入早有端倪。去年底,小米就传出以千万年薪招揽AI“天才少女”罗福莉的消息,领导小米AI大模型团队。此外,小米还搭建了GPU万卡集群,并计划2025年投入70亿元以上资金用于AI研发。
小米AI大模型主攻轻量化、本地部署,是业界首个在手机芯片上跑通十亿参数规模的大语言模型。雷军表示,小米拥有全球领先的消费级物联网平台,设备多样,一个大模型难以兼顾,因此将部分大模型能力下放到端侧,既能保护用户隐私,又能实现个性化定制。
小米致力于将AI大模型与自身业务深度协同,围绕硬件生态做深场景。目前,小米的AI技术能力已逐步接入手机、汽车、AIoT等业务板块。业内人士认为,小米此次开源的小参数规模模型为AI在手机端侧的应用提供了更坚实的模型基础。
中信建投研报指出,大模型能力不断迭代,但模型间差异缩小。这些技术需在终端设备上应用落地,形成投资到变现的闭环。小米等巨头已开始大力布局端侧AI,潜在市场巨大,AI嵌入将带来广泛的硬件升级。
(文章来源:证券时报网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。