Chat with Wiki - agent使用案例

Answer

以下是一些关于 Agent 使用的案例：

吴恩达最新演讲中提到的四种 Agent 设计范式：
- Reflection（反思）：例如让用 Reflection 构建好的 AI 系统写代码，AI 会把代码加上检查正确性和修改的话术再返回给自己，进行自我迭代。
- Tool Use：大语言模型调用插件，极大拓展了 LLM 的边界能力。
- Planning：较为新颖且有前景的方式。
- Multi-agent：也是较新颖有前景的方式。
「flowith 和它的朋友们」共同制作的最全通用 AGENT 案例合集 1.0，将案例分为三类：
- 研究工作类 AGENT
- 生活娱乐类 AGENT
- 学术艺术类 AGENT
Anthropic 提出的构建高效智能体：智能体通过与人类用户的命令或交互式对话开始工作，在执行过程中获取环境反馈，适用于难以或无法预测所需步骤数量的开放性问题。其给出的实用案例包括用于解决 SWE-bench 任务的编码智能体，以及“计算机使用”参考实现让 Claude 使用计算机完成任务。

Content generated by AI large model, please carefully verify (powered by aily)

References

我们的研究结果表明，如果你使用GPT3.5+Zero-shot的正确率为48%，GPT4+Zero-shot的正确率为67%，但是，如果你用GPT3.5+Agentic Workflow，你会得到超越GPT4的效果！因此，Agent在构建AI应用时非常重要。（然后就到了主题）尽管很多学者、专家谈论了很多关于Agent的东西，但我今天想更具体的分享我在Agent中看到比较广泛的四种设计模式（尽管很多团队，开源项目等做了很多种多样的尝试，但我还是按我的理解划分成了四类）。Reflection和Tool Use属于比较经典且相对已经广泛使用的方式，Planning和Multi-agent属于比较新颖比较有前景的方式。第一个讲的就是Reflection（反思，类似于AI的自我纠错和迭代），举个栗子，我们让用Reflection构建好的一个AI系统写个xxx代码，然后AI会把这个代码，加上类似“检查此段代码的正确性，告诉我如何修改”的话术，再返回给AI，AI可能会给你提出其中的Bug，然后如此反复，AI自己完成了自我迭代，虽然修改后的代码质量不一定能保证，但基本上来说效果会更好。（每页PPT下方，吴恩达大佬都推荐了一些相关论文，可以去看看）如上表述的是案例是Single-agent（区别于Mutli-agent的单智能体），但其实你也可以用两个Agent，一个写代码，然后另一个来Debug?这两个Agent可以用相同的LLM，也可以用不同的，这种Reflection的方式在很多场景都适用。接下来第二个是Tool Use（如果你经常玩GPT4或者国产的一些AI对话产品，那就不陌生了），大语言模型调用插件，极大的拓展了LLM的边界能力。

?️ 最全通用 AGENT 案例合集 1.0

本通用AGENT案例合集由「flowith和它的朋友们」共同制作、收纳、整理，旨在为所有用户提供一个探索AGENT能力和学习如何使用AGENT的指南库。结合目前在2025全球智能体创作大赛提交作品以及flowith用户对于Oracle的深度探索，我们将本案例合集分为三类供大家学习，他们分别是：[?研究工作类AGENT](https://waytoagi.feishu.cn/docx/LswwdL0mMogI6CxNHDfcXHMznfd#doxcna6d0H7lQwGhpWS4bIqOBlg)，[?生活娱乐类AGENT](https://waytoagi.feishu.cn/docx/LswwdL0mMogI6CxNHDfcXHMznfd#doxcnOXjk6A5T8aIXhbWZZWRZGv)，[?‍?学术艺术类AGENT](https://waytoagi.feishu.cn/docx/LswwdL0mMogI6CxNHDfcXHMznfd#doxcniRTpZRenW4vy9GbTiFaktg)。也欢迎大家在下方链接处提交新作品（不限制任何AGENT制作平台），我们将优秀作品持续更新至本案例库。[AI Agent Game 2025智能体全球特工创作大赛](https://agentga.me/)对了，如果有朋友还没有体验上制作AGENT，可以在电脑浏览器输入网址flowith.net并切换到Oracle模式体验一下，现在在注册时输入flowith提供的专属邀请码「Y8Q6WV」即可免费获得100次顶尖模型和Oracle智能体的免费使用次数。

小七姐：来自 Anthropic 的建议：构建高效智能体

随着LLM在几个关键能力上的成熟——理解复杂输入、进行推理和规划、可靠使用工具以及从错误中恢复,智能体开始在生产环境中涌现。智能体通过与人类用户的命令或交互式对话开始工作。一旦任务明确,智能体就会独立进行规划和操作,必要时会向人类寻求更多信息或判断。在执行过程中,智能体需要在每个步骤从环境中获取"基准事实"（如工具调用结果或代码执行情况）以评估其进展。智能体可以在检查点或遇到障碍时暂停等待人类反馈。任务通常在完成时终止,但也常常包含停止条件（如最大迭代次数）以保持控制。智能体虽然可以处理复杂任务,但其实现往往很直接。它们通常只是基于环境反馈在循环中使用工具的LLM。因此,清晰而深思熟虑地设计工具集及其文档至关重要。我们在附录2（"工具的提示工程"）中详细探讨了工具开发的最佳实践。使用场景：智能体适用于难以或无法预测所需步骤数量的开放性问题,且无法硬编码固定路径的场景。LLM可能需要运行多个回合,您必须对其决策能力有一定信任。智能体的自主性使其非常适合在可信环境中扩展任务。智能体的自主性意味着更高的成本和潜在的错误累积。我们建议在沙盒环境中进行广泛测试,并设置适当的防护措施。实用案例：以下是我们自己的实践案例：用于解决SWE-bench任务的编码智能体,根据任务描述对多个文件进行编辑：https://www.anthropic.com/research/swe-bench-sonnet我们的"计算机使用"参考实现,让Claude使用计算机完成任务：https://github.com/anthropics/anthropic-quickstarts/tree/main/computer-use-demo