智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。
智能体是一种自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分:
1. 规划:包括子目标和分解,将大型任务分解为更小的、可管理的子目标,从而有效处理复杂任务。
2. 反思和完善:可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,提高最终结果的质量。
3. 记忆:包括短期记忆,所有的上下文学习都是利用模型的短期记忆来学习;长期记忆,为 Agents 提供长时间保留和回忆(无限)信息的能力,通常通过利用外部向量存储和快速检索来实现。
4. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息。
智能体可以根据其复杂性和功能分为几种类型:
1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,根据温度传感器的输入直接打开或关闭加热器。
2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。例如自动驾驶汽车,不仅感知当前环境,还维护和更新周围环境的模型。
3. 目标导向型智能体(Goalbased Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,有明确的目的地,并计划路线以避免障碍。
4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。例如金融交易智能体,根据不同市场条件选择最优的交易策略。
5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。
随着 ChatGPT 与 AI 概念的爆火,出现了很多新名词,“智能体 Agent”还有 bot 和 GPTs 等。简单理解就是 AI 机器人小助手,参照移动互联网的话,类似 APP 应用的概念。在 C 端和 B 端都有相关的应用案例,比如 C 端的社交方向,用户注册之后先捏一个自己的 Agent,然后让自己的 Agent 和其他人的 Agent 聊天,两个 Agent 聊到一起后再真人介入;B 端帮助商家搭建 Agent 等。
2025-03-24