AI导读:

智谱AI在中关村论坛上正式发布全新智能体AutoGLM沉思,具备深度研究能力和实际操作能力,推动AI Agent进入新阶段。与同类产品相比,AutoGLM沉思在功能、用户体验和收费方面均有优势。

  蓝鲸新闻3月31日讯(记者朱俊熹)3月31日,大模型独角兽智谱AI在中关村论坛上正式发布全新智能体“AutoGLM沉思”。据智谱介绍,该智能体不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),推动AI Agent进入“边想边干”的新阶段。这一创新成果引发了业界的广泛关注。

  智能体作为AI技术的重要发展方向,一直备受国内外公司的青睐。本月初,中国初创企业Monica发布了其智能体产品Manus,宣称其为“全球首款通用Agent”,在科技行业掀起了热议。而此前,OpenAI也已推出deep research功能,通过智能体对复杂任务进行多步骤研究,实现高效工作。

  智谱CEO张鹏在中关村论坛的演讲中自豪地表示,“智谱很早就在布局AI Agent领域,甚至早于海外的OpenAI和Anthropic。”自去年10月起,智谱陆续推出了能够模拟人类操作手机、计算机等电子设备的智能体,支持跨应用操作,极大地提升了用户体验。例如,用户只需一句话,AI就能帮忙发微信红包或下单采购外卖。

  据智谱介绍,最新的AutoGLM沉思是国内首个正式开放给所有用户的deep research类智能体功能。除了深度研究能力外,AutoGLM沉思还具备实际操作能力,能够主动行动。这一能力的实现依赖于三个关键特性:深度思考、感知世界和工具使用。这些特性使得AutoGLM沉思能够像人类一样面对复杂问题,进行推理与决策,获取并理解环境信息,以及调用和操作工具完成复杂任务。

  “此次发布的是preview版本,主要以research类场景为主。在未来的两周内,我们将进一步扩展更多的agent场景和执行能力。”张鹏介绍称。这一消息无疑为业界带来了新的期待。

  在实测中,蓝鲸新闻向AutoGLM沉思测试版提出了一个关于AI Coding(AI编程)领域的任务:整理一份包含国内外主流AI Coding工具的行业报告。AutoGLM沉思迅速对用户的请求进行拆解,并逐步执行研究计划。其操作过程贴近人类的行为方式,会跳转打开Cursor、Windsurf等AI编程工具的官网,浏览网页并收集相关信息,最终整合到研究报告中。

图片来源:AutoGLM沉思实测

  值得注意的是,AutoGLM沉思通过浏览器插件的方式实现对网页的调用。如果用户此前未登陆相关官网,智能体在执行任务时会受阻,需要用户介入手动确认。或者它也会主动调整搜索策略,转向其他信源来获取详细信息。

图片来源:AutoGLM沉思实测

  与此同时,我们也对比了Manus在执行同一任务时的表现。虽然Manus也会主动浏览不同AI编程工具的官网,但仅体现在对步骤的简要描述中,不会像AutoGLM沉思一样弹出浏览器页面,提供直观的操作过程。

图片来源:Manus截图

  通过模拟人类浏览网页的方式,智谱的智能体AutoGLM沉思能够突破各平台间的“信息壁垒”,提供更优质的信息来源。以制定旅游计划为例,Manus等产品主要参考互联网上能被抓取到的公开信息,而AutoGLM沉思则可以触达更多相对封闭的内容生态,如小红书笔记、知乎、哔哩哔哩视频等。

图片来源:AutoGLM沉思实测

  从用户体验来看,Manus运行在独立虚拟机中,执行任务时可以关闭其页面,不影响它在后台继续工作。用户可以随时发送信息对任务进行修改、补充或要求停止。而智谱的AutoGLM沉思在任务进行过程中,不支持对任务进行修改或开启新对话,否则会直接终止任务进程。虽然AutoGLM沉思跳转打开的浏览器页面可以小窗化,但必须全程保持在线,且用户难以直观判断任务的进度。

图片来源:Manus任务进度

  在收费方面,智谱表示AutoGLM沉思将向用户免费、不限量地开放体验。相比之下,OpenAI的deep research功能需要用户每月至少付费20美元。而Manus也公布了其收费方案:Manus Starter每月收费39美元,获得3900积分;Manus Pro每月收费199美元,获得19900积分。积分是Manus使用的标准计量单位,任务越复杂或越耗时,所需积分越多。

  智谱透露,AutoGLM沉思的背后融合了新版基座模型GLM-4-Air-0414的通用能力、全新深度思考模型GLM-Z1-Air的反思能力、沉思模型GLM-Z1-Rumination以及AutoGLM的自动执行能力。其中核心链路的模型和技术预计将于4月14日正式开源。

  新版GLM-Z1-Air在性能表现上可媲美Deepseek-R1。其推理速度相比R1提升了8倍,成本可以降低至1/30。基于GLM-Z1训练出的沉思模型GLM-Z1-Rumination能够通过更长的深度思考时间来换取更优的效果,突破了实时联网搜索、动态工具调用、深度分析和自我验证等技术瓶颈。

  “相比于传统的推理模型,我们期待沉思模型能够引领AI助手进入一个‘高智商+高自主’的新阶段。”智谱充满信心地表示。

(文章来源:蓝鲸财经