智元机器人发布GO-1大模型,加速具身智能普及
AI导读:
智元机器人正式发布GO-1大模型,该模型通过学习人类视频助力机器人完成任务,平均成功率提高32%。GO-1大模型支持部署到不同机器人本体,将加速具身智能普及,推动人形机器人产业迅速扩张。
最近,华为离职“天才少年”彭志辉的官宣在互联网刷屏。与此同时,智元启元大模型如期而至,为科技界带来新动向。
智元机器人官微宣布,正式发布首个通用具身基座大模型Genie Operator-1(GO-1),并配以视频,展示了GO-1通过学习人类视频,助力机器人本体完成递送水杯、制作餐点、迎接外宾等一系列任务。视频末端还详细展示了仿真数据采集及大规模真机数据采集的过程画面。
从性能上看,GO-1相比已有模型在成功率上有了显著提升,平均成功率提高了32%。经过实验验证,GO-1在“倒水”“清理桌面”“补充饮料”等具体任务中表现尤为突出。

为了充分利用高质量的AgiBot World数据集及互联网大规模异构视频数据,智元机器人提出了Vision-Language-Latent-Action(ViLLA)架构,以增强策略的泛化能力。
去年底,智元机器人联合上海人工智能实验室等单位,宣布开源百万真机数据集项目AgiBot World。该项目涵盖超过100种真实场景,其中40%为家居场景,20%为工业场景,共收录80余种人类生活必备技能。
然而,据智元机器人方面透露,尽管AgiBot World等带动作标签的真机数据量已初具规模,但仍远不及互联网数据集。基于ViLLA架构,智元机器人采用Latent Actions(隐式动作)建模,实现了外部动作知识向通用操作任务的转移。
据悉,GO-1大模型通过整合人类和多种机器人数据,展现出强大的新任务适应能力。同时,该模型还支持部署到不同形态的机器人本体上。智元机器人将GO-1大模型的这一系列特点归纳为以下四个方面:
人类视频学习:GO-1大模型能够结合互联网视频和真实人类示范进行学习,从而增强对人类行为的理解。
小样本快速泛化:GO-1大模型具备强大的泛化能力,能够在极少数据甚至零样本的情况下,快速适应新场景和新任务。
一脑多形:GO-1大模型作为通用机器人策略模型,能够在不同形态的机器人之间灵活迁移。
持续进化:借助智元的一整套数据回流系统,GO-1大模型能够从实际执行中遇到的问题数据中持续学习,实现自我进化。
智元机器人表示,GO-1大模型的推出将加速具身智能的普及,推动机器人从依赖特定任务的工具向具备通用智能的自主体转变。
当前,基础模型发展迅猛。信达证券指出,AI的快速发展从根本上推动了人形机器人和自动驾驶等端侧应用的进步。随着Grok3/o3-mini等模型对物理定律理解的逐步加深,以及Deepseek等模型推理成本的迅速降低,端侧更高级别的智能落地可期,人形机器人产业或将迎来迅速扩张。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。