AI导读:

全球首款生成式人形机器人运动大模型“龙跃”正式发布,标志着我国在智能体运动控制领域迈入领先行列。该模型以自然语言驱动为核心,颠覆传统运动控制范式。同时,数据质量控制成为具身智能发展的关键挑战,国地中心等机构正推进相关标准制定。

虽然具身智能还未迎来GPT时代,但国内外人形机器人企业正加速推进应用落地,力求在核心技术上实现突破。

5月29日,2025张江具身智能开发者大会上,国家地方共建人形机器人创新中心联合复旦大学正式发布全球首款生成式人形机器人运动大模型——“龙跃”(MindLoongGPT)。这一发布标志着我国智能体运动控制领域迈入全球领先行列。

全球首款生成式人形机器人运动大模型的意义

“龙跃”大模型以“自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆了传统运动控制范式。

国地中心首席科学家江磊在接受第一财经记者采访时表示,人形机器人是一个全身具有移动性的整体,双臂、腰部和双足需协同动作以保持平衡。他认为,应有一个全身运动的大模型来解决端到端问题。此次首发的针对移动能力和操作能力的大模型,能在实际数据采集困难的情况下,生成更多仿真级动作,构成更完整的具身智能数据集,成为实体训练场的重要补充。

他提到的训练场是全国首个异构人形机器人训练场,于今年1月21日启用,首期部署了超100台异构人形机器人,以10余种典型应用场景的建设,牵引形成上海人形机器人超级中心。作为数据生产工厂,它能产生更多数据供具身智能大模型企业使用,加速行业发展。

“龙跃”大模型联合发布方——复旦大学信息科学与工程学院教授陈涛在大会的“张江论剑”科创沙龙上表示,具身智能距离GPT时代尚有距离。此次与国地中心联合发布的“龙跃”能根据用户输入产生动作,如用户说出“挥手致意”或上传参考视频,模型即可自动解析语义并生成连贯动作。这打破了传统方法依赖专业参数调整的桎梏,实现“人人可用”。

他补充解释,通过“龙跃”MindLoongGPT生成特技动作运动轨迹,作为部署的全身跟踪小模型的输入目标观测,可在青龙上实现丰富的全身动作。目前已在青龙机器人上进行了demo验证,并在仿真平台上针对全尺寸人形机器人进行了数据生成。

数据的重要性

具身智能所依赖的数据来源广泛、形式多样,对模型训练和技能获取至关重要。当前,国内外企业正加快数据集构建和训练场建设,但如何在保证数据数量的同时确保高质量,仍是行业面临的一大难题。

中国信通院人工智能研究所安全与具身智能部副主任颜媚在“张江论剑”上表示,数据资源主要包括真机数据、合成数据和互联网中的多模态数据。尽管多种数据来源为具身智能的发展提供了丰富资源,但应用推广仍面临数据需求量巨大和数据质量把控两大挑战。相比无人驾驶领域,具身智能所涉及的环境复杂性更高,空间不确定性往往是无人车的几十倍。因此,如何短时间内构建大规模、可用性强的数据集,成为当前亟待突破的难题。

基于上述挑战,中国信通院和国地中心联合推进了具身智能数据质量及评估标准的制定工作。该标准围绕数据全生命周期的管理,明确提出从数据采集、清洗、标注到最终使用过程中各关键环节的质量控制要求;建立了七大质量评价指标;从组织管理角度构建制度保障,以期形成一个定量和定性兼备的全面数据生态体系。

江磊表示,今年国地中心自己的训练场将完成高质量实体数据集,成为国际上最大的数据聚集地。同时,他们还联合企业和省市一级的创新中心,打造出将近2500万条的数据,以发展更智能的大模型。

他透露,今年年底将把具身智能大模型的操作精度从约70%~80%优化提升到90%,基本达到ChatGPT-3的水平。未来还需采集更多数据,达到PB级的量级,以满足具身智能数据体量的要求。

会议当天,国地中心还正式发布了“致知”具身应用开发平台,该平台基于前期与上海大学联合发布的“格物”具身智能仿真平台相关工作。

据国地中心介绍,“格物-致知”通用具身智能开发平台深度融合OpenLoong(人形机器人开源社区)核心软件框架,形成具身智能应用一站式+向导式的快速开发管道。同时,以开源开放的机制持续推动人形机器人开发范式从“单点突破”迈向“生态共建”,并依托麒麟具身智能训练场规模化数据采集与白虎百万开源数据集,快速形成具身基础大模型库,加速人形机器人在实际场景的应用落地。

国地中心研发总监邢伯阳分享称,目前中心的麒麟训练场已成功搭建起从具身数据到大模型的一站式开发基础设施,整合了一百多家异构机器人同步进行数据采集,为后续模型训练提供了坚实的数据支撑。

在邢伯阳看来,人形机器人赛道正迎来量产元年的重要时刻。从数据采集、模型训练到技能整合的全链路探索,正成为推动整个行业突破的重要因素。未来应用场景的快速形成不仅依赖于庞大的数据和高精度模型,更需要通过集成开发平台将各个技术模块高效融合,实现从底层操作系统中间件、芯片适配到上层生态开发的无缝对接。只有解决好模型技能组合为可落地应用这一核心问题,才能真正实现全套端到端应用的突破。

(文章来源:第一财经)