AI导读:

VLA模型作为全新技术范式,正加速崛起引领自动驾驶技术新变革。谷歌DeepMind推出控制机器人VLA模型,迅速渗透至智能驾驶领域。国内企业如特斯拉、理想汽车、华为等积极布局,面临车端芯片硬件挑战及商业化探索。

  纵观自动驾驶技术的发展历程,人工智能的不断突破显著提升了自动驾驶的感知性能。自2025年起,一种名为视觉语言动作模型(VLA,Vision-Language-Action)的全新技术范式正在加速崛起,引领智能驾驶的新篇章。

  新技术崛起引领变革

  VLA模型最早应用于机器人行业,通过结合文本和视觉数据,输出可执行动作,实现了AI与物理世界的深度交互。2023年7月28日,谷歌DeepMind推出全球首个控制机器人的VLA模型,如今这一创新概念正迅速渗透至智能驾驶领域,被视为端到端方案的升级版。

  中国自动驾驶产业创新联盟调研员高超指出,VLA模型的核心在于其“思维链”推理能力,能从传感器数据中提取环境信息,理解人类指令,生成可解释的决策过程,最终转化为驾驶操作,增强用户信任,推动智能驾驶从“功能时代”向“体验时代”迈进。

  高超预测,VLA模型有望在两年内重塑智能驾驶市场竞争格局,其深度融合端到端与多模态大模型,实现感知到车辆运动规划和决策的直接转换,更接近理想状态。预计2025年VLA模型的量产落地,将显著提升城区NOA渗透率。

  当前,智能驾驶市场竞争已从功能实现转向技术范式竞争,强调技术架构的先进性和可持续性。高盛自动驾驶报告显示,到2030年,VLA模型主导的端到端方案或占据L4级市场60%份额,传统一级供应商价值链面临重构。

  电车巨头与本土企业齐发力

  电车巨头特斯拉凭借Dojo超算中心形成的自研芯片集群,针对视觉数据优化,或将成为VLA模型变革的受益者。同时,国内企业如理想汽车、华为、百度等也在积极布局。理想汽车启动L4级别自动驾驶预研,结合车端VLA模型与云端世界模型;华为通过智驾3.0融合GOD网络与VLA模型,实现无高精地图区域厘米级定位;百度Apollo依托文心大模型,大幅提升VLA模型的交通场景理解准确度。

  据新战略低速无人驾驶产业研究所统计,2024年国内自动驾驶领域公开185起重要投融资事件,融资总金额超370亿元,端到端技术公司表现活跃。

  面临挑战与商业化探索

  尽管前景广阔,但下一代端到端方案仍面临现实挑战。车端芯片硬件尚不足以支撑多模态大模型部署,高阶智驾算力硬件难以满足VLA模型需求。同时,如何将端到端技术与多模态大模型深度交融,考验着智驾团队的模型框架定义和快速迭代能力。

  商业化之路亦非坦途。2024年上市的智能驾驶相关企业多处于亏损状态,研发费用高昂。消费者虽对智能驾驶接受度上升,但支付意愿下滑,对智能驾驶进行支付的用户占比从2022年的42%下降至2024年的28%。

  此外,供应链竞争同样激烈。英伟达Orin芯片虽占据主导,但地平线征程6的BPU架构针对VLA模型优化,能效比大幅提升,争夺车载计算市场主导权。

  中国乘用车产业联盟秘书长张秀阳认为,VLA模型引发的技术变革正重塑自动驾驶产业格局,或催生分层市场。在Robotaxi领域,混合运营架构可能长期共存;而在量产车市场,VLA模型有望成为高阶智驾标配。这不仅是技术竞赛,更是汽车和智驾行业认知与技术范式的迁移。

(文章来源:证券日报)