AI导读:

Manus作为通用AI Agent迅速爆火,其内测邀请码被炒至数万元。产品具备独立思考能力,能执行复杂任务。虽然存在争议,但其在GAIA基准测试中已超过DeepResearch成为第一。未来,Manus将专注于完善体验,并可能开启融资计划。

爆红的运气终于轮到了大模型应用层公司。

3月5日晚,一款名为“Manus”的Agent(智能体)产品发布。24小时内,它迅速成为国内AI大模型领域讨论度最高的产品,甚至其内测邀请码在二手电商平台被炒至数万元。

关于Manus的舆论迅速分化,推崇与质疑声此起彼伏,同时还有客观理智看待的中间派。为何会有这样的景象?因为有报道将其比作“AI Agent产品的DeekSeek时刻”,并大量运用“国运级创新”等词汇。一时间,对于这类评判的纷争反而吸引了更多关注。

面对产品的爆火,Manus AI团队产品负责人张涛(HideCloud)在朋友圈发文表示,过去的十几个小时对团队来说如同一场充满意外的冒险。团队低估了大家的热情,原本作为产品探索阶段性收获分享的内测,未曾想引起巨大波澜。

那么,Manus究竟是一款什么样的产品?如果它不是Agent的Deepseek时刻,那它引领我们来到了怎样的节点?

一个可替代人的通用AI Agent

Manus定位为“通用AI Agent”,不同于传统针对单个任务、具有严格规则和流程的Agent,它是一个多模型、多智能体产品,拥有“独立思考”能力,能对复杂通用任务进行多步骤拆解并执行。

用户只需提出“一句话任务”,一段时间后便能得到一个高质量的成品。例如,在简历筛选任务中,它能解压文件、浏览简历、记录信息,并反馈排名建议、候选人简介及评估标准。若用户需要更直观结果,它还能立刻生成表格。

Manus还具备记忆功能,在下次生成类似任务结果时会优先输出表格形式。整个过程在云端异步完成,用户可随时关闭电脑,等待结果生产。

此外,Manus在房产调研任务中展示了其研究能力,能拆解用户需求维度,推进信息搜索,并编写Python程序核对预算,过滤房地产网站上的房屋选项,最终输出详细调研报告。在股票分析任务中,它能准确获取专业数据,编写程序进行可视化数据分析,并根据新需求在线部署全新网站。

关于Manus的争议之一是“套壳”,即没有自研底层大模型的能力。其模型能力来自Anthropic的Claude,但Manus并不讳言这一点。据分析,其技术架构还可能包含专用RL小模型和自研工具包生态。

在实测体验中,Manus近乎于DeepResearch、Computer Use以及Cursor等众多AI应用的集合体。一名用户表示,体验非常顺畅,虽然没有太多新技术,但整合得很完美。

目前,在GAIA基准测试中,Manus已超过OpenAI的DeepResearch成为第一。

技术门槛不高,靠产品理念和工程能力取胜

随着Manus获得如此热度,外界开始关注这家应用层公司团队的来历。团队代表主要包括产品负责人张涛和首席科学家季逸超。

张涛曾在字节跳动负责国际化产品,后担任光年之外产品负责人。季逸超是前Magitech Labs创始人,开发的iOS浏览器“猛犸”曾获MacWorld特等奖。创始团队还包括夜莺科技创办人肖弘,以及联合张涛创办Monica的肖弘。

Manus诞生的前提是基座模型性能提升,但为何率先获得关注的是Manus?团队核心理念是“Less structure, more intelligence”,给予AI更多自主权以决定如何使用工具和完成任务。

尽管Manus团队的产品理念和工程能力受到认可,但技术门槛并不高。大概两年前,Auto-GPT就代表过类似产品想法的兴起。

Manus之所以爆火,是因为成功打出用户体验上的低门槛和时间差。大批用户未使用过价格昂贵的o1或DeepResearch,因此容易被Manus惊艳。但其优势在于引领我们迈向自主阶段,即Autonomous AGI。同时也不宜将其捧得过高,它尚未形成自己的数据飞轮。

关于商业模式,有受访者认为2美元单次任务的成本过高,但也有认为在保证质量与服务稳定后,可尝试付费模式。基于AHPU这一新指标,Manus或将打造出独属于AI的商业模式。

否则在烧钱状态下,Manus难以完成规模化。受访者认为,目前2美元单次任务的成本可能只是平均数或中位数,许多动辄两小时的任务生成,其消耗成本应更高。

针对Manus的下一步发展,一名关注AI领域的投资人认为它将专注于完善体验,并严格控制产品放量。团队也已声明,当前Manus距离正式版还有很大提升空间。

该投资人还推断,2025年会出现更多自主AI Agent,Manus AI团队或许需要开启融资计划。智谱、字节跳动、阿里巴巴、腾讯等大厂也可能迅速跟进这一产品方向。

2025年Agent的爆发已成为行业共识,行业静待第二个“Manus”的水平。

(文章来源:界面新闻)