AI导读:

MiniMax新一代Agent旗舰大模型M2.7发布,该模型具备自我进化能力,可参与训练、优化与迭代过程。在强化学习场景中表现出色,能自主调整参数、优化策略并提升效果。未来有望实现全流程自动化,显著压缩研发周期。

  3月18日,《中国经营报》记者从国内AI公司MiniMax(00100.HK)方面获悉,其新一代Agent旗舰大模型M2.7正式发布,相较于之前的M2系列,M2.7的核心突破不再局限于性能提升,而是提出了一个更具范式意义的方向——模型自我进化,即让模型深度参与自身的训练、优化与迭代过程。

  MiniMax方面透露,从技术路径来看,M2.7的关键在于构建了一套以Agent为核心的自我进化系统。在该体系中,模型不仅承担生成与推理任务,还通过构建复杂的Agent Harness(智能体执行框架),参与数据处理、实验设计、训练调优与评测反馈等完整研发流程。换言之,模型开始成为模型研发流程的一部分,而非单一工具。

  以强化学习(RL)场景的具体实践为例,Agent能够从实验设想出发,通过与研究员讨论,协助研究员完成文献调研、实验设计、任务执行,并在过程中自动进行日志分析、Bug排查、指标优化和代码修复,显著降低人工介入频率。官方数据显示,在部分研发流程中,M2.7已可承担30%至50%的工作量。

  更具突破性的是,M2.7具备“自我优化闭环”。在内部测试中,模型可连续执行超过100轮“分析—改进—验证”的循环,自主调整采样参数、优化工作流策略,并在内部评测集中实现约30%的效果提升。

  在SWE-bench Pro测试中,M2.7正确率达到56.22%,接近国际顶级模型水平;在更贴近真实场景的VIBE-Pro与Terminal Bench 2测试中,分别取得55.6%和57.0%的成绩,体现出其在端到端项目交付和复杂系统理解上的能力。

  分析人士认为,如果自我进化能力进一步成熟,未来AI系统有望实现从数据构建、模型训练到评测优化的全流程自动化,这将显著压缩研发周期,并重塑AI产业的成本结构与竞争格局。目前,M2.7已在MiniMax Agent及开放平台上线。

(文章来源:中国经营报)