AI Agent 是一种融合感知、分析、决策和执行能力的智能体,具有自主决策和行动能力,能够理解并适应复杂环境,根据目标自主思考、制定计划并执行相应任务。
相较于 Copilot 的工具型辅助能力,Agent 更注重对环境的实时感知和判断,更像人类一样形成独立的决策和行动方案。目前,50%的企业已经在某项工作中进行了 AI Agent 的试点,另有 34%的企业正在制定应用计划,主要应用于智能终端、智能座舱、汽车自动驾驶、工业机器人和人形机器人等领域。
AI Agent 基于大型语言模型(LLM)和其他技术实现,其包括几个重要概念:
此外,还需要三个 Agent:
随着全球 AI 市场快速升温,新的 AI 应用不断涌现,AI Agent 被认为是当下大模型最激动人心的发展主线,在满足企业智能化需求、强化内外部协同效能等方面发挥着重要作用,让“人机协同”成为新常态。
钉钉AI助理白皮书Agent/智能体/Agent则是融合感知、分析、决策和执行能力的智能体,具有自主决策和行动能力,可以理解并适应复杂环境,根据目标,自主思考、制定计划并执行相应任务。相较于Copilot的工具型辅助能力,Agent更注重对环境的实时感知和判断,更像人类一样形成独立的决策和行动方案。IDC调研显示,Agent被普遍认为是AI应用发展的趋势性方向,50%的企业已经在某项工作中进行了AI Agent的试点,另有34%的企业正在制定AI Agent的应用计划,主要应用于智能终端、智能座舱、汽车自动驾驶、工业机器人和人形机器人等领域。目前已发布的AI Agent以通用AIAgent居多,在使用成本、速度、技术成熟度上仍存在一定的局限,未来突破的关键在于计算机视觉等底层技术的突破。Copilot/智能助手/Copilot指将生成式AI技术融入各种应用场景,根据用户给出的具体任务或问题,能够像助手一样理解需求和意图,并提供相应的解决方案,是最广泛的AI应用形态。Copilot应用多落地于协同办公场景,例如微软推出的AI助理Copilot Pro,赋能Office套件,可以作为用户的智能办公助手,自动生成Word文档、Excel图表、PPT演示文稿,根据用户邮件内容自动提供回复建议或安排日程。0102
随着全球AI市场快速升温,新的AI应用不断涌现,2023年上半年,AI应用下载量突破3亿次,同比增长114%,超过2022年全年水平(数据来源:Sensor Tower)。AI Agent是当下大模型最激动人心的发展主线,被称为“大模型下一场战事”“最后的杀手产品”“开启新工业革命时代的Agent-centric”。在满足企业智能化需求的过程中,AI Agent作为一种理想的产品化落地形态,正在承接日益复杂的提质增效需求;通过强化内外部协同效能,它可以释放组织核心生产力,对抗组织熵增带来的挑战。AI Agent让“人机协同”成为新常态,越来越多的业务活动都将被委托给AI,而人类则只需要聚焦于企业愿景、战略和关键路径的决策上——B端企业和C端个人都将步入AI助理时代,在以AI Agent为代表的AI应用加持下,越来越多的创新将会源自于超级个体和小型组织。在一些领域里,一个人加上足够的AI工具,就可以成为一家专业化公司。
AI Agent:基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。AI Agent包括下面几个概念:Chain:通常一个AI Agent可能由多个Chain组成。一个Chain视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的Chain是大语言模型完成的LLM Chain。Router:我们可以使用一些判定(甚至可以用LLM来判定),然后让Agent走向不同的Chain。例如:如果这是一个图片,则a;否则b。Tool:Agent上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。总结下来我们需要三个Agent:Responser Agent:主agent,用于回复用户(伪多模态)Background Agent:背景agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)Daily Agent:每日agent,用于生成剧本,配套的图片,以及每日朋友圈Responser AgentDaily AgentBackground Agent每隔一段时间运行一次(默认3分钟)分析期间的历史对话变更人物关系(亲密度,了解度等)变更反感度,如果超标则拉黑用户抽简对话内容,提取人物和用户的信息成为“增长的记忆体”按照时间推进人物剧本有概率主动聊天(与亲密度正相关,跳过夜间时间)