“Manus 没有 DeepSeek V3/R1 般惊艳,更多是融合 MCP 和 Operator 的技术炒作。
在 Deepseek 发布开源 5+1 日后,Manus 接上了世界通往 AGI 之路的大旗,吗?
在仔细观摩其产品细节后,大家可能是把 Manus 日期记错了,去年 10 月 22 日定义成发布日刚刚好,那天是 Anthropic Claude 发布其 computer use 的好日子,换句话说,LLM 跳出 ChatBot 的日子,成为在网络空间游荡、试探的 Agent 的诞生日,只不过 OpenAI 的 Operator 要到 2025 年 1 月才真正出生。
概念有些多,我们来逐步拆解,用 CoT(思维链)的方式一窥 Manus 究竟是什么。
“通往对话框之外的道路,是由授权铺就的。
OpenAI 伟大之处不在于 GPT,Transfomer 范式是谷歌发明的,真正创新在于将 Chat 作为人机交互的第一入口,我们可以将其理解为一个智能的数据库,可以大体上回答你的任意问题,但是更多强调是“解惑”而非“帮你解惑”,比如你可以问 ChatGPT 如何治疗感冒,GPT 可以按照不同情况列出答案,但是无法具体诊断,也无法下单买药。
从这个意义上而言,DeepSeek 的价值在于让模型更聪明(DeepSeek V3),并且加强诊断能力(DeepSeek R1),能判断出究竟是病毒性感冒,还是天气转凉冻的。
但是 AI 依然无法帮你买药,此时的 GPT 完全体被封印在对话框内,我们希望将其释放出来。
Computer Use 便应运而生,从路径设计上而言,其和最简单的键鼠精灵、苹果捷径和 Apple Script 等外在形式类似,即都是替代人手 + 键盘、鼠标(或屏幕点击)的操作,但内在不同,你不需要自定义脚本规则,只需要通过对话方式,命令 Claude 进行对应的操作。
此时,AI 可以帮你打开浏览器,输入美团地址,并进行搜寻感冒药,但新的问题也会出现,AI 需要你的美团账号,才能定位离你最近的药店。
我们需要在底层给予 AI 更多的权限。
这也是 Anthropic 发布 MCP(Model Context Protocol),即模型上下文协议,以及 OpenAI 推出 Operator 的必要之举,LLM 内部的优化已经达到局部最优,现在需要让 AI/LLM 动起来,LLM 和 LLM 需要互相调用,LLM 和外部 API 需要互相融合,LLM 和人类也需要进一步协作。
先简单聊一下 MCP,之后会出文章详细解释。
MCP 的价值在于希望构建 LLM 时代的通用 API/SDK 框架,MCP 希望能规范 AI 模型和其他应用之间的沟通格式,比如 Claude/OpenAI/DeepSeek 都用相同的格式调用代码补全或者创建美团买药的规则,如此一来,无论用户使用的是什么模型,美团都只需配置相同的接口。
这并不意味着 OpenAI/DeepSeek 或者美团都必须遵守 Anthropic 的具体规则,但是可以参考来设计,如同 ONNX(开放神经网络交换,Open Neural Network Exchange) 一样,模型的泛滥自然需要对应协作标准。
但是不管用谁,都需要用户告知其自己的美团账号密码,以及给予支付宝授权,并且接管呼叫系统,以此完成定位、下单、接打快递员电话的流程,最终你需要下楼去快递柜拿药,暂时 AI 还不能替你跑腿,具身智能机器人还需要时间。
DeepSeek 的意义在于极低成本的前提下,LLM 变得更为聪明,并且中文推理能力远超同行,这是其在技术和产品上的伟大意义,更不要说开源模式让 AI 更为接地气。
这里就是 Manus 的取巧之处,Manus 并不是 OpenAI 的 Operator,或者遵循 Anthropic 的 MCP 规则,相当于重新发明了一次轮子。
当然,中国人也需要在模型标准方面有所建树,不能再走操作系统和芯片的老路,但是这跟所谓的 AGI 没有太多关系,因为迄今为止没看到 Manus 的基座大模型是什么,如果是自研的、更智能的大模型,那确实可喜可贺。
“跨链桥的对手不是链抽象,而是 CEX;AI Agent 的敌人不是智能体,而是钱包。
在 Manus 靠媒体、内测码和同名币刷屏之后,真真假假辟谣中,Web3 AI agent 也跃跃欲试,Virtuals 宣布集成 Enso Shortcuts,方便用户一键交互,目前支持 200 个协议。
开心的一面是,Web3 AI Agent 开始越过模型之争,老老实实向真正的用户需求迈进,但是显然,Web 2 老问题依旧会存在,支持哪一种协议标准?
以跨链桥为例,LayerZero 通过数年努力,才基本成为事实上的行业标准协议,但是依然无法打通全部场景,无他,CEX 尤其是币安才是最方便的资产跨链桥,而链间消息通信并不是当前痛点。
而 Web3 AI Agent 的最重要尝试方向是建立用户、自身和 Uniswap / Hyperliquid 之间的联系,也就是 AI Agnet 要成为事实上的中间人、私钥持有人或者托管方,否则,用户体验无法和现有基建耦合出的钱包 +DEX 体验相媲美,更遑论去跟 CEX 抢市场。
这样说,并不是否定 DeFAI 的前景,而是指出其真实存在的障碍——并不是智能程度,而是如何取得用户信任的问题,Manus 需要和 MCP、Operator 抢标准定义权,那么 DeFAI 项目方也需要有如此觉悟。
所有的 AI Agent 项目都要坚持长期主义,不断的迭代和试错,才能等到自己的初始用户,事实上,DeFAI 的对手是钱包这一产品形态,而非其他的智能体。
如同行业存在托管钱包和非托管钱包两种范式,AI Agent 现在最大的问题在于策略乏力和资金安全,资金安全如前所述,而策略在于用户授权之后,即使用户敢于授权给 Agent,也需要面临策略设置的问题,一句话,AI 帮用户理财,究竟可靠与否?
Web3 AI Agent 目前的模型和框架之争尚未分出胜负,更近一步的策略优化,还未有项目真正的投入实用,马斯克曾经畅想的 Robotaxi 目前还在路上,AI 理财大师何时能进入每个币圈钱包内?
必须强调,本文不是对 Manus 的否定,毕竟工作流(Workflow)+ Claude + Cursor 已经足够好用,再多一点也无妨,AI 大泡沫你不吃,别人也会吃。
本文也不适对 Web3 AI Agent 的否定,毕竟熬夜看盘 + 看管私钥 + Safe 不出错也足够安全,能让 DeFAI 替人 PVP 也可以拯救熬夜的青春。
只是有一点,都不要造假,造假鼻子会变长。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。