创新型AI智能体Manus引发关注,任务成功率成焦点
AI导读:
创新型AI智能体Manus虽处于封闭测试阶段,但已引发广泛关注。新京报贝壳财经记者实测发现,Manus更新后任务成功率有所提升,但仍存在服务负载高、无法创建任务等问题。专家指出,Manus的创新在于产品层面,当前最大阻碍是生态封闭。
最近一周,AI圈最热的词当属Manus。这款由北京红色蝴蝶科技有限公司推出的创新型AI智能体产品,虽然尚处于封闭测试阶段,但已经引发了广泛关注。Manus既收获了“下一个Deepseek”的高规格赞誉,也因任务失败率高等问题而受到质疑。
北京时间3月10日至11日,Manus在官方社交平台回应了外界关切,公司联合创始人、首席科学家季逸超披露了Manus使用的底层模型与开源代码。3月10日17点,Manus进行了2小时的维护,季逸超表示,维护后Manus的故障率大幅下降,但系统压力也更大,团队正在努力解决问题。
Manus“更新前后”的产品表现有何不同?新京报贝壳财经记者对此进行了视频、网页、文字、游戏四个维度的测试。测试发现,3月11日更新后,Manus任务的成功率从50%提升至66.66%,但仍存在“当前服务负载较高,无法创建任务”的情况。
快思慢想研究院院长、原商汤智能产业研究院创始院长田丰表示,应提倡AI原生的颠覆式创新,Manus团队值得提倡和鼓励。他们正不断追求新一代的AI原生应用模式和体验,这对行业的发展具有重要意义。
记者实测:更新后任务成功率明显上升
相比于大语言模型类产品的对话框交互方式,Manus的优势在于可以执行用户命令,且完全“可视化”。用户可以通过屏幕右侧的“Manus的电脑”窗口,完整看到Manus从思考、浏览网页到写程序甚至检测bug的全过程。
然而,在体验过程中,许多用户反馈Manus完成用户提交任务的成功率并不高。记者向Manus提出了8项任务要求,其成功完成了4项,任务成功率为50%。例如,要求Manus以清朝康熙时期“九子夺嫡”为背景设计一款游戏时,程序出现了停滞不动的状况。

而在3月11日更新后,记者向其提出了6项任务要求,Manus成功完成了4项,成功率达到了66.66%。失败的2项任务也并非中断,而是在任务开始之前就提示“当前服务负载较高,无法创建任务”。
季逸超表示,他们几乎把Manus的上下文限制翻了一倍,还增强了沙盒硬件,使得故障率大幅下降。但随着故障率降低,会话运行时间变长,系统压力增大,失败率又开始回升。他们正在努力解决这些问题。
回答问题耗时较长,答案比大语言模型更全面
记者测试发现,根据任务难度的不同,Manus执行任务的时间也不同。对于文字类任务,Manus的执行时间约为15分钟至20分钟。而对于涉及网页交互的任务,Manus耗时更长,但最终成功制作出了一个可以进行互动的网页产品。

贝壳财经记者通过实测发现,Manus执行任务的时间一般在15分钟左右,对于文字类的回复其执行相对轻松,并且能生成多个文档。例如,在提出“浏览B站热门视频,推测可能爆火的科技新闻类选题,并设计文案”这一任务时,Manus给出了包括“B站科技内容受众分析”在内的四个文档,回答的内容更加充分。
当然,Manus也并非“无所不能”。例如,在设计漫画作品的任务中,Manus只生成了文字框架和分镜设计,表示无法直接绘制图像或创建视觉艺术作品。此外,Manus在浏览网站时使用的是游客身份,当遇到需要登录才能浏览的内容时,就会发生访问失败的情况。
田丰指出,在需要精准信源的领域,如分析特斯拉股价时,Manus只能抓取二手信息,无法直接获取财报原文。这可能对用户决策造成实质性误导。
外部关注度上升,创新在于产品层面
与DeepSeek的传播路径不同,Manus是由国内先行传播。近期,英文用户对Manus的讨论正逐渐增多。田丰认为,Manus作为产品的核心突破在于构建了任务调度引擎,具有三个创新点:能够将复杂任务分解成清晰的子任务清单;像增强版搜索引擎一样主动抓取网页资料进行归纳整理;支持实时查看任务进度条。
然而,Manus目前仍存在短板。田丰实测发现,Manus执行复杂任务时超过40%会失败。他认为,当前Manus更适合生活场景而非专业场景。
有消息称,Manus平台将与阿里通义千问团队达成战略合作。对此,阿里通义方面回复称,双方确实在进行开源模型方面的合作。
多位观看Manus云电脑窗口的用户表示,看着Manus在窗口中“很努力”地执行任务,对AI Agent有了更直观的理解。智灵动力CTO朱旭琪认为,Manus把OpenAI曾展示过的“虚拟机”操作做出了比较好的交互性。
对于Manus所代表的AI Agent类产品在未来的发展,田丰认为,当前最大的阻碍是生态封闭。解决路径包括通过生态协商开放MCP接口或模拟人类操作接管用户账号完成动作,但都面临现实阻碍。
(文章来源:新京报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。