Agent

单智能体= 大语言模型(LLM) + 观察(obs) + 思考(thought) + 行动(act) + 记忆(mem)
多智能体=智能体 + 环境 + SOP + 评审 + 通信 + 成本

多智能体优点:

  1. 多视角分析问题:虽然LLM可以扮演很多视角,但会随着system prompt或者前几轮的对话快速坍缩到某个具体的视角上;
  2. 复杂问题拆解:每个子agent负责解决特定领域的问题,降低对记忆和prompt长度的要求;
  3. 可操控性强:可以自主的选择需要的视角和人设;
  4. 开闭原则:通过增加子agent来扩展功能,新增功能无需修改之前的agent;
  5. (可能)更快的解决问题:解决单agent并发的问题;

缺点:

  1. 成本和耗时的增加;
  2. 交互更复杂、定制开发成本高;
  3. 简单的问题single Agent也能解决;

多智能体能解决的问题:

  1. 解决复杂问题;
  2. 生成多角色交互的剧情;

Multi-Agent并不是Agent框架的终态,Multi-Agent框架是当前有限的LLM能力背景下的产物,更多还是为了解决当前LLM的能力缺陷,通过LLM多次迭代、弥补一些显而易见的错误,不同框架间仍然存在着极高的学习和开发成本。随着LLM能力的提升,未来的Agent框架肯定会朝着更加的简单、易用的方向发展。

参考资料