AI导读:

昨晚,杭州举办的《CMG世界机器人大赛·系列赛》机甲格斗擂台赛圆满落幕,宇树科技G1人形机器人表现出色。业内人士指出,机器人底层算法已相当出色,但仍缺乏真正的空间智能大模型作为核心大脑。产业链或将涌现更多专业机器人解决方案商,进行软件二次开发。

  “左右勾拳、侧踢、膝踢、闪避、跌倒起身,被KO……”一场机器人之间的格斗比赛在昨晚开打。

  昨晚,杭州举办的《CMG世界机器人大赛·系列赛》机甲格斗擂台赛上,宇树科技作为合作方参赛,派出宇树 G1人形机器人,内嵌算法由四个比赛团队自研,现场手柄操控。经过激烈比拼,黑队“AI策算师”脱颖而出,荣获冠军。

  宇树科技相关负责人向《科创板日报》透露,本次比赛格斗动作数据,采集自外部专业人员,为AI模型学习提供重要参考。

  比赛过程中,机器人暴露出动态控制、感知能力等方面的不足,但也展现出强大的平衡控制和人机协同能力。

  业内人士向《科创板日报》分析指出,从格斗过程来看,机器人底层算法已相当出色,但仍缺乏真正的空间智能大模型作为核心大脑。为推进实际应用落地,产业链或将涌现更多专业机器人解决方案商,基于公版机器人开发专业大脑。

  ▍拳脚相加!机器人遭重击后5秒起身

  在格斗过程中,参赛机器人通过步伐调整保持平衡,被击中后能迅速起身。“格斗效果虽一般,但摔倒后爬起的灵活性令人惊叹,支撑力十足。”有观众感叹道。

  “机器人倒地后五秒内迅速起身,重心不稳时也能调整身形维持平衡,这两点给我留下深刻印象。” 快思慢想研究院院长、上海交通大学计算法学与AI伦理研究中心联席主任田丰表示,“两足机器人的动态平衡性远难于四足。四足机器人的重心落在四个脚组成的矩形内,支撑面积大。而两足人形机器人的重心需落在两足连线内。”

  据悉,宇树G1机器人保持平衡,主要得益于仿真环境的AI强化学习和本体关节感知。通过大量平衡数据的学习和模拟训练,机器人不断优化平衡控制策略,同时本体关节的高精度传感器实时感知身体各部位姿态和受力情况,为平衡控制提供关键数据。

  IMU(惯性测量单元)在机器人平衡控制中发挥着关键作用,在仿真训练中同样不可或缺。IMU能够实时监测机器人的姿态、加速度等信息。

  值得一提的是,宇树科技G1手臂采用定制化设计,拥有7个自由度,比常规的5个自由度多出两个,旨在格斗中灵活施展勾拳、摆拳等拳击动作,增加攻击角度和灵活性。

  上述人员介绍,G1格斗模式训练难度极高,一是瞬间爆发力要求高,需强大动力系统提供足够扭矩,实现快速动作响应;二是对控制算法精准度和稳定性要求高,需实时处理大量传感器数据,精确计算身体各部位运动轨迹与发力时机,实现毫秒级精准控制,保证动作有力且协调;三是机械结构强度要求高,格斗时机械结构需承受巨大冲击力,对关节、骨骼等结构强度和稳定性提出高要求。

  ▍人机协同为主,操作员手柄遥控机器人对战

  G1机器人操控方式多样,包括AI语音操控、手柄操控、体感操控。本次比赛主要采用手柄操作方式。比赛现场,操作员通过手柄控制机器人进行格斗。

  宇树科技相关负责人表示,AI语音操控响应延迟明显,影响实时控制。手柄操控更直观、精准,易于上手,有利于扩大参赛范围。体感操控在沉浸感上更具潜力,宇树已开发体感人形机器人控制系统,后续比赛或将启用。

  中国信通院泰尔系统实验室副总工程师刘泰指出,机器人手柄操控与普通遥控玩具存在区别,人形机器人背后是一套复杂的大模型和运动控制算法支撑。

  “传统控制方法难以让机器人保持平衡,现在通过强化学习训练,让机器人自主探索平衡方式。比赛振奋人心,机器人表现比以往更出色,在对抗激烈的情况下也能保持稳定性,全身运动机构协调,是科技进步和产业进步的完美结合。”刘泰表示。

  田丰认为,“在暂无法实现通用人工智能AGI的前提下,人机协同成为业内探索方向。本次比赛展现出一定成果,具有重要价值。”

  ▍实时感知仍存困境,机器人大脑待突破

  然而,遥控机器人也存在失误情况。如主动攻击对手时扑空,导致失去稳定性倒地;试图后退调整对战角度时,被擂台围绳缠住,需人类解绑等。这暴露出机器人动态运动控制与实时感知的不足。

  “这引发一个问题:机器人是否需完成仿真人类形态?例如,人背后无眼睛,机器人是否应设置摄像头扩大感知范围?人只有5个手指,但某些工业场景6个手指可能更佳。人形机器人或许只是过渡阶段,未来可能发展出超越人形的机器人形态。”田丰表示。

  业内人士认为,从格斗过程看,机器人底层算法已相当出色,包括稳定性、视觉、灵活性、速度连贯性等,但目前缺乏真正的空间智能大模型作为核心大脑

  田丰指出,中美在机器人大脑投入上,美国比例更大。“国内企业大多专注于机器人本体,部分企业在做运动控制系统(小脑)。做机器人大脑的企业仅占约1/20。不过,已有一些企业正在进行大脑研发。”

  从产业链看,田丰认为,业界更多关注整机厂商和电机等硬件层面,而大脑是通用型基础性大脑。“但机器人整机需软件二次开发,才能更好地应用于实际场景,如格斗、工厂、物流等。后续产业链将涌现更多机器人解决方案商,在公版机器人基础上开发专业大脑。这涉及多模态大模型和RAG知识库融合。”

(文章来源:财联社)