Chat with Wiki - 有没有multi agent相关项目可以推荐一下吗

Answer

以下是为您推荐的一些与 multi agent 相关的项目：

《Multi Agent 策略架构基础（1）》：https://waytoagi.feishu.cn/record/1sfvunQZGoT5vB2r29i9PWi6W ，其中介绍了有代表性的 Multi Agent demo 项目包括 AutoGPT、Smallville 小镇和面壁智能 ChatDev，探讨了 Multi Agent 领域的相关内容以及其面临的挑战和限制。
吴恩达最新演讲中提到的清华面壁智能的开源项目 ChatDev，展示了多智能体协作的场景，如不同身份的智能体合作开发小游戏。

此外，为您补充一些关于 multi agent 的知识：多智能体（Multi-Agent）是由多个自主、独立的智能体（Agent）组成的系统。每个智能体都能感知环境、决策并执行任务，且它们之间能信息共享、任务协调与协同行动以实现整体目标。

随着大型语言模型（LLM）的出现，以 LLM 为核心构建的 Agent 系统受广泛关注。目前常见框架集中在单 Agent 场景，其核心是 LLM 与工具协同配合，可能需与用户多轮交互。而多 Agent 场景为不同 Agent 指定角色，通过协作完成复杂任务，与用户交互可能减少。

构建多 Agent 框架主要组成部分包括：

环境（environment）：所有 Agent 处于同一环境，环境包含全局状态信息，Agent 与环境有信息交互与更新。
阶段（stage）：采用 SOP 思想将复杂任务分解为多个子任务。
控制器（controller）：可以是 LLM 或预先定义好的规则，负责环境在不同 Agent 和阶段之间切换。
记忆：在多 Agent 框架中，由于 Agent 数量增多，消息数量及每条消息需记录的字段也相应增加。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023 年历史更新（归档）

《[Multi Agent策略架构基础（1）](https://waytoagi.feishu.cn/record/1sfvunQZGoT5vB2r29i9PWi6W)》是作者对逐渐升温的Multi Agent领域的探索，有代表性的Multi Agent demo项目包括AutoGPT、Smallville小镇和面壁智能ChatDev，Multi Agent有潜力解决复杂问题，但仍需面对挑战和限制；城主发表了一篇《[2023年的大模型：OpenAI科学家最新讲座（完整版）](https://waytoagi.feishu.cn/record/1sfvuPPwj8ZTnMvEQIwaSJRxY)》，Hyung Won Chung从Google跳到OpenAI一年多，他在网络上所做的LLM技术分享中提供了LLM在2023年的最新动向和大量技术细节，颇有价值；《[马丁的](https://waytoagi.feishu.cn/record/1sfvun2KibnFAT2lXmbW1SynB)[Character.AI](https://waytoagi.feishu.cn/record/1sfvun2KibnFAT2lXmbW1SynB)[赛道说明书](https://waytoagi.feishu.cn/record/1sfvun2KibnFAT2lXmbW1SynB)》详细分析了NPC赛道，它通过创造虚拟角色和提供陪伴服务来满足用户的需求，而不是通过认识新的人或建立人际关系。这个赛道的关键在于技术的发展和商业利益的引入，以及创作者生态的建设；

四种 Agent 设计范式（通俗易懂版）-- 吴恩达最新演讲

（这一部分介绍的比较少）现在用的比较多的就是使用Copilot进行联网搜索，以及在解决某数理逻辑问题时，调用代码插件来辅助解决。第三个是Planning（规划），非常惊艳的设计，用户输入任务，AI拆解流程、选择工具、调用、执行并输出结果。我在做一些demo时会遇到一些错误，但Agent绕过了我的错误，自主地完成了任务。我在这里举一个例子，改编自HuggingGPT这个论文，我需要生成一个图片，一个女孩在看书，她的姿势要个我给的这个图片中的男孩一样，然后你再用文字描述这篇文章。Agent的做法是，先提取该图片中男孩的姿态（可能是调用的Huggingface上的模型），然后再找到一个模型生成一张同样姿势的图片，最后再描述好生成的这张图片。Agent的效果不一定保证非常好，但大部分情况比较高效，比如我之前谷歌搜索会花费大量时间，现在我会丢一个问题给Agent，然后过一会来看它给的回复。最后一个是Multi-agent，多智能体协作（吴恩达在这里的举例，来自清华面壁智能的开源项目ChatDev）。每个Agent被赋予了不同的身份，比如有的是CEO，有的是产品经理，有的是程序员，他们互相合作互相对话，比如你让他们开发一个简单的小游戏，他们会花几分钟时间来编写代码并测试。尽管有时候不是很有效，但非常有前景和想象力，它模拟了现实生活中的工作场景，Multi-agent不仅仅只能执行单一任务，而是成为了一个复杂系统。最后是结论，我认为未来，得益于Agentic Worklfow，AI能做出来更多牛逼的应用。但现在我们等待Agent的回复需要比较长的时间，所以更快的token生成速度是很重要的（吴恩达在此又扯了个故事，表达的意思是人性就是希望即时满足）。

问：Multi-Agent是什么

多智能体（Multi-Agent）是由多个自主、独立的智能体（Agent）组成的系统。在这个系统中，每个智能体都能够感知环境、进行决策并执行任务，同时它们之间可以进行信息共享、任务协调以及协同行动，以实现整体的目标。[heading2]关于Multi-Agent[content]随着大型语言模型（LLM）的出现，以LLM为核心构建的Agent系统近期受到了广泛关注。Agent系统旨在利用LLM的归纳推理能力，为不同的Agent分配角色和任务信息，并配备相应的工具插件，以完成复杂的任务。目前，更常见的框架主要集中在单Agent场景下。单Agent的核心在于LLM与工具的协同配合。LLM根据用户任务的理解，推理出需要调用的工具，并根据调用结果向用户提供反馈。在任务完成过程中，Agent可能需要与用户进行多轮交互。与此同时，越来越多的Agent框架开始关注多Agent场景。为了完成任务，多Agent会为不同的Agent指定不同的角色，并通过Agent之间的协作来完成复杂的任务。与单Agent相比，在任务完成过程中，与用户的交互可能会减少一些。[heading2]主要组成部分[content]为构建一个多Agent框架，我们需要思考相对于单Agent，框架中增加了哪些组件。环境（environment）：所有Agent应该处于同一个环境中。环境中包含全局状态信息，Agent与环境之间存在信息的交互与更新。阶段（stage）：为了完成复杂任务，现有多Agent框架通常采用SOP思想，将复杂任务分解为多个子任务。控制器（controller）：控制器可以是LLM，也可以是预先定义好的规则。它主要负责环境在不同Agent和阶段之间的切换。记忆：在单Agent中，记忆只包括用户、LLM回应和工具调用结果等部分。而在多Agent框架中，由于Agent数量增多，导致消息数量增多。同时，每条消息可能需要记录发送方、接收方等字段。