从Manus到OpenManus:多智能体协作框架如何重构AI生产力?

发布于:2025-03-10 ⋅ 阅读:(17) ⋅ 点赞:(0)

Manus:封闭生态下的通用AI智能体

  Manus是由中国团队Monica.im研发的全球首款通用型AI智能体,其核心定位是将生成式AI的认知能力转化为实际生产力。通过多智能体协作框架,Manus能够理解复杂指令、规划任务并调用工具链(如代码执行器、浏览器自动化)直接交付成果,例如自动生成股票分析报告、筛选简历或规划旅行行程。其技术亮点包括:
  (1)多智能体架构:任务分解Agent、工具调用Agent、质量校验Agent分工协作,形成任务处理流水线;
  (2)云端异步执行:用户下达指令后,任务在独立虚拟机中运行,即使设备关闭仍可云端完成;
  (3)性能突破:在GAIA基准测试中,复杂任务处理得分超过OpenAI同层次模型23个百分点。
  然而,Manus因封闭生态(邀请码稀缺且被炒至上万元)和“套壳”争议备受质疑,其技术实现依赖现有大模型与工具链整合,缺乏底层算法创新。

OpenManus:开源社区的闪速复刻

  面对Manus的封闭性,MetaGPT团队仅用3小时复刻出开源版本OpenManus,并登上GitHub趋势榜,开源18小时Star数已达4.4k,截至发稿,Star数已达12.6k。其核心设计聚焦模块化多智能体协作框架:
  (1)主代理(Manager Agent):解析需求并分配任务,类似“项目经理”;
  (2)规划代理(Planning Agent):拆解复杂任务为可执行步骤(如将“分析SEO”分解为数据抓取、技术检查等);
  (3)工具调用代理(ToolCall Agent):集成开源工具链(如browser-use浏览器自动化、computer-use沙盒环境)。
  (4)支持自定义模型(如Claude 3.5、Qwen VL Plus、GPT-4o等)和工具链扩展。

挑战与未来:框架落地的现实边界

当前局限性

  (1)复杂任务处理瓶颈:多Agent协作需频繁调用外部API,一旦某一环节失败(如网络波动导致数据抓取中断),整体流程可能崩溃。
  (2)模型依赖风险:框架高度依赖底层大模型的推理能力,若模型厂商调整API策略(如费用或功能限制),系统稳定性将受冲击。
  (3)安全与伦理隐忧:沙盒环境中的代码执行可能引入恶意脚本,而自动化操作若缺乏透明度,易引发用户信任危机。

未来演进方向

  (1)强化学习优化协作:通过模拟人类团队协作中的纠错机制(如Agent间的相互验证),提升任务容错率。
  (2)垂直领域深度适配:在医疗、金融等场景中定制专用Agent(如合规审查代理),强化行业适用性。
  (3)开源生态协同进化:建立工具链标准化协议(如统一API规范),推动多智能体框架的跨平台兼容。

OpenManus使用指南

  开源后博主亲自体验了一番,效果相比原版Manus还是差了一点意思,具体效果还要取决于模型的能力,博主使用的是千循的付费接口。

1. 环境配置

conda create -n open_manus python=3.12
conda activate open_manus

git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

pip install -r requirements.txt -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

2. 参数配置

cp config/config.example.toml config/config.toml

# vim config/config.toml
# Global LLM configuration
[llm]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."  # Replace with your actual API key
max_tokens = 4096
temperature = 0.0

# Optional configuration for specific LLM models
[llm.vision]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."  # Replace with your actual API key

3. 替换搜索引擎

  代码默认使用的是GoogleSearch,有魔法的小伙伴可忽略,没有魔法的小伙伴没可以使用BaiduSearch来平替,具体如下:

pip install baidusearch 

# vim app/tool/google_search.py
# from googlesearch import search
from baidusearch.baidusearch import search

4. 运行效果

python main.py

  输入的指令:深度调研和Manus这个Agent有关的信息,自己整理信息,然后写一个新闻html页面介绍它,你写的html应该尽可能美观。必须使用中文。生成的文件都会放在D:\liyanpeng\github\OpenManus目录下。

在这里插入图片描述
  运行结果如下,虽不算精美,但基本遵循了指令:

在这里插入图片描述

协作框架开启AI生产力革命

  未来,多智能体框架的演进需突破复杂任务容错性(如API调用稳定性)和垂直领域适配性(如医疗合规审查代理),但其核心价值已清晰——当技术堆垒趋于透明,工程化能力与协作设计将成为AI生产力的核心引擎(前提是基座模型要足够的强大)。
  这场由多智能体驱动的生产力革命,正在重新定义人机协作的边界。