跳转到主要内容
SEO Title

category

概念
完成本教程后,您将能够:

  • 理解MetaGPT的代理和环境概念
  • 代理如何相互交互以及多代理协作可能是什么样子


其目的是提供对概念的直观和简化的解释,以便用户有进一步探索教程系列的背景。在我们力求清晰的同时,我们也认识到简化可能会产生不准确或遗漏。因此,我们鼓励更多地浏览后续文档,以获得完整的理解。
如果您想先动手编写代码,也可以跳到Agent101
如果您想要更严格的解释,请查看我们的论文


代理


学术界和工业界对“代理人”一词提出了各种定义。粗略地说,一个代理人应该能够像人类一样思考或计划,拥有记忆甚至情感,具备与环境、其他代理人和人类互动的特定技能。在综合考察中,代理人本身就是一个复杂的系统。
在我们看来,我们将代理人想象成一个环境中的数字有机体,其中


Agent=大型语言模型(LLM)+观察+思考+行动+记忆


这个公式概括了代理函数的本质。为了理解每个组件,让我们将其与人类功能进行比较:

  1. 大型语言模型(LLM):LLM作为主体“大脑”的一部分,使其能够处理信息、从互动中学习、做出决策和执行行动。
  2. 观察:这是药剂的感觉机制,使其能够感知环境。代理人可能会接收一系列信号,如来自另一代理人信息的文本输入、来自监控摄像头的视觉数据或来自客户服务记录的音频。这些观察结果构成了所有后续行动的基础。
  3. 思维:思维过程包括分析观察结果、从记忆中汲取经验和考虑可能的行动。这是代理人的内部决策过程,可能由LLM提供动力。
  4. 行动:这些是代理人对其想法和观察的明显反应。它们的范围从使用LLM生成代码到手动预定义的操作(如读取本地文件)。代理还可以执行使用工具的操作,包括在网上搜索天气、使用计算器计算等等。
  5. 记忆:特工的记忆存储了过去的经历。这对学习至关重要,因为它允许主体参考以前的结果并相应地调整未来的行动。


MultiAgent


多代理系统可以被认为是一个代理社会,其中


MultiAgent=代理+环境+标准操作程序(SOP)+通信+经济


这些组成部分中的每一个都发挥着至关重要的作用:

  1. 代理:以上单独定义,多代理系统中的代理协同工作,每个代理都有其独特的LLM、观察、想法、行动和记忆。
  2. 环境:环境是代理存在和交互的共享空间。代理从环境中观察重要信息,并发布操作输出供其他人使用。
  3. 标准操作程序(SOP):这些是管理代理行为和交互的既定程序,确保系统内有序高效的操作。例如,在汽车制造SOP中,一个代理焊接汽车零件,而另一个代理安装布线,从而维持有序的装配线。
  4. 沟通:沟通是代理人之间的信息交流。这对于系统内的协作、谈判和竞争至关重要。
  5. 经济:这是指多主体环境中的价值交换系统,决定资源的分配和任务的优先级。

插图

这是一个简单的示例,展示了代理如何工作

  1. 在环境中,三个代理Alice、Bob和Charlie相互作用。
  2. 他们可以将消息或其操作输出发布到环境中,而其他人则会观察到这些消息或操作输出。
  3. 我们揭露了一个特工Charlie的内心过程。同样的过程也适用于Alice和Bob。
  4. 在内部,Charlie代理拥有我们上面介绍的组件。它们是LLM,观察,思想,行动,其中思想和行动过程可以由LLM授权。代理也可以在其操作过程中使用工具。
  5. Charlie观察Alice的相关文档和Bob的要求,回忆有用的记忆,思考如何编写代码,采取实际的编写行动,并最终发布任何结果。
  6. Charlie通过将其发布到环境中来通知Bob其操作结果。鲍勃收到信后报以称赞。

现在您对这些概念有了初步了解。请随意进入下一步,看看MetaGPT如何为您提供创建代理及其动态的框架。

标签