AI导读:

春节前夕,大模型厂商MiniMax(稀宇科技)上线新一代文本模型MiniMax M2.5,旨在解决AI Agent规模化落地的成本与性能瓶颈问题。该模型在编程能力、工具调用和推理速度等方面均有优异表现。

  新华财经上海2月13日电(记者杜康)春节前夕,大模型厂商MiniMax(稀宇科技)正式上线新一代文本模型MiniMax M2.5。该模型定位于“原生Agent生产级模型”,旨在通过编程、工具调用及推理效率上的突破,解决AI Agent(智能体)规模化落地的成本与性能瓶颈等问题。据悉,M2.5在多个关键生产力场景中表现优异。编程能力方面,M2.5在评估大型语言模型(LLMs)编程能力的基准测试榜单SWE-Bench Verified中得分80.2%。更重要的是,模型展现出“原生Spec能力”,即在编码前能主动拆解架构和规划功能,更接近真实架构师的工作模式。工具调用方面,M2.5模型能够自动处理复杂任务,在BrowseComp、WideSearch等多项Agent任务中,以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20%;在办公应用场景中,在Word、PPT、Excel金融建模等场景中的能力也取得了显著提升。MiniMax表示,性能之外,M2.5的另一核心亮点在于推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。这意味着1万美元理论上可支持4个Agent连续工作一年。M2.5已于2月12日在 MiniMax Agent上线,并于13日全球开源支持本地化部署。