春节刚过,我们还沉浸在讨论Deepseek的热潮中,3月AI圈又给我们带来了一个新的“网红”——Manus。这个AI工具就像一阵旋风,瞬间席卷了整个互联网圈子!
Manus到底有多火?几乎每个刷手机的人都能感受到这股热浪,AI博主们争先恐后地发布Manus相关内容,好像谁不发就落伍了。微博热搜榜上Manus的话题一个接着一个,刷屏程度堪比“明星恋情曝光”。
更夸张的是,二手交易平台上Manus的邀请码居然被炒到了数万元一个!

当然Manus也不是低调出场,它直接扛起了“对标Deepseek”的大旗昂首走来。打开社交媒体,那些自媒体的标题简直比电视购物还要夸张,像“全球首个通用型AI Agent”、“第二个国运级AI产品”、“震惊硅谷”……
这些词汇组合在一起,仿佛在告诉我们,不了解Manus,就OUT了!
那么这个“全球首个通用型AI Agent”到底是个什么工具?它真的有媒体说的那么神乎其神吗?它又能为我们的生活和工作带来哪些实际的便利呢?
让我们一起揭开这个被热搜和高价邀请码包裹着的Manus,看看它的真实面目究竟如何!
一、Manus的本质是AI Agent
Manus是由中国团队Monica.im开发的通用型自主AI Agent,这个团队另一个产品就是火爆海外的Monica AI插件。
和ChatGPT、DeepSeek这样的以对话为主的大模型不同,传统的对话大模型更像是一个“顾问”的角色,我们告诉它需求,它告诉我们答案,但是落地执行和检验答案往往需要我们自己操作。
Manus更像是一个助理,我们只需要告诉它最终目标,中间的事情全都不用操心,它可以自己思考、自己规划任务,然后通过自动浏览网页,调用各种工具来完成复杂任务。整个过程都不需要我们人类在旁边盯着、纠正它!
当然Manus的所有能力都是基于AI大模型的能力基础去完成的,只不过多了一些调用外部工具和API的能力。比如说,当需要搜索某些信息的时候它可以自己去搜索查找相关的文献资料等。
说了这么多抽象的内容,可能大家对Manus能干嘛还是听得云里雾里,直接展示2个Manus的官方案例:
1.使用Manus写一个AR/AI眼镜研究分析报告
https://manus.im/share/H0qKlZ5mxeegdUa2u6VRMf?replay=1
2.使用Manus设计一个动量定理互动课程
https://manus.im/share/pAdLIvlktJmV945593mFio?replay=1
看完这两个视频就知道Manus的能力是什么了对吧,简单来说它可以完整的模拟人类对电脑的操作,比如一边查阅资料一边写研究分析报告,又或者一边查资料一边设计课程。
除了上面展示的案例,我们还可以用Manus撰写传播策划案,编写程序,写述职报告等。
听到这里,小伙伴们可能会疑惑,上面这些能力不是用Deepseek这样的AI也能做到吗?为什么要多此一举用Manus呢?
这个问题问得好!让我用一个简单的例子来说明AI与AI Agent之间的本质差别。在使用传统AI时,我们常常需要帮助AI拆解任务,比如写一篇文章时,最好先让AI把大纲写出来,再让它以此写出每个部分的内容,最后拼接成一篇完整的文章。
而Manus在实际任务执行中,恰好就帮我们完成了这一部分!它能自动将复杂任务分解成多个小步骤。
如果是用普通AI,整个过程会是这样的,我们需要先帮AI找到这个2048小游戏的网站,然后还得告诉AI游戏规则,最后AI才能开始玩游戏。整个过程中,需要我们不断引导和指示AI该怎么做。
而用Manus,我们只需要下达一个指令——“想玩2048这个游戏,并拿到最高分”,它就会自动将任务拆分成多个小步骤:找到游戏网站、学习规则、制定策略、执行游戏操作......全程不需要我们的干预,最终它会完成游戏并向我们展示结果。


再以写旅游攻略为例,普通AI最终会在对话框里给我们一段长文字,而Manus则能自动查询各种旅游信息,还会整合图文、制作精美排版,还能突破AI输出内容的限制,给到我们更详细的攻略。最终交付一份“拿来就能用”的成品,一个完整的PDF文档。
其实早在Manus之前,你就可能就已经用上AI Agent,豆包就有很多智能体,下图这个“拍照识万物”就是一个很好的例子。它作为一个专门用于图像识别的基础智能体,已经在实际应用中展现了AI Agent的基本特性。
当然和Manus相比,这类AI Agent功能相对单一,主要依靠预训练知识和内置能力,能够帮助用户完成特定的任务,比如识别图片中的物体并给出相关解答,但其能力范围和自主性都相对有限。

除了豆包之外,“秘塔AI搜索”也是一种相对基础的AI Agent。它的特别之处在于能够自主决定搜索策略,调用搜索功能,并根据用户提问和搜索到的资料给出更准确、可靠且完善的回答。
当我问“什么是AI Agent,举例说明”时,秘塔AI搜索并不像普通大语言模型那样直接给出答案。它会先将这个问题拆分成几个小问题,就像是解决一个复杂数学题时先分解成几个简单步骤一样。然后它会逐个回答这些小问题,最后把所有信息整合成一个完整的回答。
这种工作方式就像是一位认真的研究生在写论文,先理清思路,再查阅资料,最后形成自己的观点,而不是凭直觉随口回答。这样的回答质量自然会更有保障。


二、Manus的缺点依旧明显
现阶段,从官网展示的案例来看,Manus的能力确实令人印象深刻,但就像AI刚出现时那些明显的“AI味”和“AI幻觉”一样,Manus虽然优点显著,缺点也相当明显。
就拿上下文长度这个问题来说吧,它就像是一个人的短期记忆容量——再聪明的人也记不住太多信息。Manus执行的大多数任务,最终都会卡在上下文限制上。比如下面这个2048游戏的例子,原本计划让Manus玩5局,结果才玩了2局就不得不停下来了。
根本原因还是基础的AI大模型支持的上下文长度有限。当交互内容积累到一定程度,系统就无法再处理更多信息,只能中断任务。

当然这个问题后续还是非常好优化的,这就像是手机内存从最初的几MB发展到现在的几百GB一样,时间会解决大部分的容量问题限制。
再有就是AI幻觉问题,相信读过我文章的读者都已经知道现阶段每个AI都会有幻觉存在。Manus是基于通用大语言模型构建的,所以幻觉问题自然也会出现。而且,当它一次性连续完成多个任务时,幻觉发生的概率更高,甚至会像滚雪球一样越滚越大。
目前大量实操案例都表明,Manus交付的最终成果中往往都存在错误,需要人工进一步筛查。
另外,在执行任务时,Manus也无法获取许多优质资源。比如当我们让它写一篇关于AI Agent的科普报告时,它可能发现网上有一篇非常好的参考文章,但因为浏览这篇文章需要所在平台的账号密码,无法直接获取。Manus就像被挡在图书馆门外的学生,看得到书但拿不到手。这种“看得见吃不着”的问题在很多实操场景中都会发生。
三、Agent是AI发展的趋势之一
尽管Manus目前还存在上下文限制、AI幻觉累积和资源获取受限等问题,但不可否认,AI Agent确实代表了人工智能发展的重要趋势。
Manus这类通用型AI Agent正是弥合了强大AI能力与实际应用场景之间的鸿沟。
这种转变意义重大。对普通用户而言,AI不再是一个需要精心“喂养”提示词的工具,而是一个能真正理解并执行任务的助手。对企业而言,AI Agent能大幅降低AI落地的门槛,让更多行业和场景能够切实享受到AI带来的效率提升。
未来,随着技术的进步,我们有理由相信AI Agent的能力边界会不断扩展:更长的上下文窗口将支持更复杂的任务执行,更精准的推理能力将减少幻觉问题,更丰富的权限管理将解决资源访问的限制。
当然在这个AI技术快速发展的时代,Manus的出现不是终点,而是起点。它向我们展示了AI不仅可以“思考”,还可以“行动”。无论是个人效率提升,还是企业数字化转型,AI Agent都将成为连接AI技术与实际应用的重要桥梁,帮助我们真正释放大模型的潜力,实现AI的广泛落地。
如果想要加入我的AI社群,关注公众号,加我微信即可。