以下是一些关于 Agent 使用的案例:
我们的研究结果表明,如果你使用GPT3.5+Zero-shot的正确率为48%,GPT4+Zero-shot的正确率为67%,但是,如果你用GPT3.5+Agentic Workflow,你会得到超越GPT4的效果!因此,Agent在构建AI应用时非常重要。(然后就到了主题)尽管很多学者、专家谈论了很多关于Agent的东西,但我今天想更具体的分享我在Agent中看到比较广泛的四种设计模式(尽管很多团队,开源项目等做了很多种多样的尝试,但我还是按我的理解划分成了四类)。Reflection和Tool Use属于比较经典且相对已经广泛使用的方式,Planning和Multi-agent属于比较新颖比较有前景的方式。第一个讲的就是Reflection(反思,类似于AI的自我纠错和迭代),举个栗子,我们让用Reflection构建好的一个AI系统写个xxx代码,然后AI会把这个代码,加上类似“检查此段代码的正确性,告诉我如何修改”的话术,再返回给AI,AI可能会给你提出其中的Bug,然后如此反复,AI自己完成了自我迭代,虽然修改后的代码质量不一定能保证,但基本上来说效果会更好。(每页PPT下方,吴恩达大佬都推荐了一些相关论文,可以去看看)如上表述的是案例是Single-agent(区别于Mutli-agent的单智能体),但其实你也可以用两个Agent,一个写代码,然后另一个来Debug?这两个Agent可以用相同的LLM,也可以用不同的,这种Reflection的方式在很多场景都适用。接下来第二个是Tool Use(如果你经常玩GPT4或者国产的一些AI对话产品,那就不陌生了),大语言模型调用插件,极大的拓展了LLM的边界能力。
本通用AGENT案例合集由「flowith和它的朋友们」共同制作、收纳、整理,旨在为所有用户提供一个探索AGENT能力和学习如何使用AGENT的指南库。结合目前在2025全球智能体创作大赛提交作品以及flowith用户对于Oracle的深度探索,我们将本案例合集分为三类供大家学习,他们分别是:[?研究工作类AGENT](https://waytoagi.feishu.cn/docx/LswwdL0mMogI6CxNHDfcXHMznfd#doxcna6d0H7lQwGhpWS4bIqOBlg),[?生活娱乐类AGENT](https://waytoagi.feishu.cn/docx/LswwdL0mMogI6CxNHDfcXHMznfd#doxcnOXjk6A5T8aIXhbWZZWRZGv),[??学术艺术类AGENT](https://waytoagi.feishu.cn/docx/LswwdL0mMogI6CxNHDfcXHMznfd#doxcniRTpZRenW4vy9GbTiFaktg)。也欢迎大家在下方链接处提交新作品(不限制任何AGENT制作平台),我们将优秀作品持续更新至本案例库。[AI Agent Game 2025智能体全球特工创作大赛](https://agentga.me/)对了,如果有朋友还没有体验上制作AGENT,可以在电脑浏览器输入网址flowith.net并切换到Oracle模式体验一下,现在在注册时输入flowith提供的专属邀请码「Y8Q6WV」即可免费获得100次顶尖模型和Oracle智能体的免费使用次数。
随着LLM在几个关键能力上的成熟——理解复杂输入、进行推理和规划、可靠使用工具以及从错误中恢复,智能体开始在生产环境中涌现。智能体通过与人类用户的命令或交互式对话开始工作。一旦任务明确,智能体就会独立进行规划和操作,必要时会向人类寻求更多信息或判断。在执行过程中,智能体需要在每个步骤从环境中获取"基准事实"(如工具调用结果或代码执行情况)以评估其进展。智能体可以在检查点或遇到障碍时暂停等待人类反馈。任务通常在完成时终止,但也常常包含停止条件(如最大迭代次数)以保持控制。智能体虽然可以处理复杂任务,但其实现往往很直接。它们通常只是基于环境反馈在循环中使用工具的LLM。因此,清晰而深思熟虑地设计工具集及其文档至关重要。我们在附录2("工具的提示工程")中详细探讨了工具开发的最佳实践。使用场景:智能体适用于难以或无法预测所需步骤数量的开放性问题,且无法硬编码固定路径的场景。LLM可能需要运行多个回合,您必须对其决策能力有一定信任。智能体的自主性使其非常适合在可信环境中扩展任务。智能体的自主性意味着更高的成本和潜在的错误累积。我们建议在沙盒环境中进行广泛测试,并设置适当的防护措施。实用案例:以下是我们自己的实践案例:用于解决SWE-bench任务的编码智能体,根据任务描述对多个文件进行编辑:https://www.anthropic.com/research/swe-bench-sonnet我们的"计算机使用"参考实现,让Claude使用计算机完成任务:https://github.com/anthropics/anthropic-quickstarts/tree/main/computer-use-demo