AI导读:

智元机器人发布首个通用具身基座大模型,基于Vision-Language-Latent-Action架构,实现小样本快速泛化,解决具身模型落地难题。AI对于机器人企业战略意义凸显,行业将迎来更多竞争与挑战。

经历了过去一年的沉淀和发展之后,具身智能机器人公司的发展路径逐渐明朗。在科技日新月异的今天,机器人行业正迎来新的变革。

3月10日,由华为前“天才少年”稚晖君创立的智元机器人(以下简称:智元)发布首个通用具身基座大模型:智元启元大模型(GenieOperator-1)。该模型基于Vision-Language-Latent-Action(ViLLA)架构,由VLM(多模态大模型)+ MoE(混合专家)组成,这一创新设计使机器人能够持续学习进化,通过模仿人类视频,实现小样本快速泛化,将具身智能提升至新高度。

模型发布后,智元合伙人、具身业务部总裁姚卯青和智元具身研究中心常务主任任广辉接受了媒体采访,深入探讨了AI与机器人行业的未来。采访中,数据、AI成为高频词汇,两者对于智元的战略意义不言而喻。随着2025年的到来,机器人行业的竞争将更加白热化。

智元启元大模型的发布,旨在解决具身模型在落地应用中的难题。任广辉指出,当前许多具身模型的泛化能力不足,难以适应新场景,且数据成本高企,行业缺乏统一的数据回流系统,导致模型性能难以持续提升。而ViLLA架构通过结合视觉、语言大模型及人类操作视频学习,构建了通用能力,实现了小范围泛化,降低了使用门槛和后续训练成本。

银河通用机器人的一位研发工程师表示,在内部讨论中,企业间的数据量对比更能反映各自进度,数据质量决定算法形式,进而影响机器人行动轨迹,至关重要。为解决数据不足问题,银河通用发布GraspVLA大模型,通过合成大数据预训练,实现零样本测试。

此外,特斯拉等巨头也在积极布局,通过招聘操作员收集动作数据,以解决机器人企业数据匮乏的难题。AI对于机器人企业的战略意义日益凸显,任广辉强调,不做大模型的机器人公司将失去未来。

随着具身智能、智能机器人被写入政府工作报告,行业将迎来更多新玩家,竞争也将更加激烈。姚卯青指出,企业间的比拼将聚焦于团队规模、产品研发实力、商业化能力等方面,综合实力过硬的企业将抢占先机。据国际机器人协会预测,2021年至2030年,全球人形机器人市场规模年复合增长率将高达71%,中国市场潜力巨大。

在AI技术路线的选择上,各家企业存在差异。智元、银河通用等强调AI投入的重要性,而宇树科技等则更注重本体硬件的发展。随着行业的快速发展,机器人企业的发展路线和商业化模式开始分化,哪种模式更能受到市场认可尚待检验。

(文章来源:新京报)