Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

智能体分为哪几类

Answer

智能体主要可以分为以下几类:

  1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,它根据温度传感器的输入直接打开或关闭加热器。
  2. 基于模型的智能体(Model-based Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。比如自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。
  3. 目标导向型智能体(Goal-based Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,它有明确的目的地,并计划路线以避免障碍。
  4. 效用型智能体(Utility-based Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。比如金融交易智能体,根据不同市场条件选择最优的交易策略。
  5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。

此外,在 Menlo Ventures 的观点中,智能体还分为以下三种主要类型:

  1. 决策智能体:使用语言模型来遍历预定义的决策树。
  2. 轨道智能体:为智能体配备了更高层次的目标,但同时限制了解决空间,要求遵循标准作业程序并使用预先设定的“工具”库。
  3. 通用人工智能体:本质上是没有任何数据支架的 for 循环,完全依赖于语言模型的推理能力来进行所有的计划、反思和纠正。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:什么是智能体 Agent

智能体可以根据其复杂性和功能分为几种类型:1.简单反应型智能体(Reactive Agents):这种智能体根据当前的感知输入直接采取行动。不维护内部状态,也不考虑历史信息。示例:温控器,它根据温度传感器的输入直接打开或关闭加热器。2.基于模型的智能体(Model-based Agents):维护内部状态,对当前和历史感知输入进行建模。能够推理未来的状态变化,并根据推理结果采取行动。示例:自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。3.目标导向型智能体(Goal-based Agents):除了感知和行动外,还具有明确的目标。能够根据目标评估不同的行动方案,并选择最优的行动。示例:机器人导航系统,它有明确的目的地,并计划路线以避免障碍。4.效用型智能体(Utility-based Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动。评估行动的优劣,权衡利弊。示例:金融交易智能体,根据不同市场条件选择最优的交易策略。5.学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能。学习模型、行为策略以及目标函数。示例:强化学习智能体,通过与环境互动不断学习最优策略。

AI 智能体:企业自动化的新架构 - Menlo Ventures

很明确,未来的完全自主智能体可能会拥有所有四个构建块,但今天的LLM应用程序和智能体还没有达到这个水平。例如,流行的RAG架构不是智能体式的,而是以推理和外部记忆作为其基础。一些设计,如[OpenAI的结构化输出](https://openai.com/index/introducing-structured-outputs-in-the-api/)甚至支持工具使用。但重要的区别在于,这些应用程序将LLM作为语义搜索、综合或生成的"工具",但它们采取的步骤(即逻辑流)仍由代码预先确定。对比来说,当您将LLM置于应用程序的控制流中并让它动态决定要采取的行动、要使用的工具以及如何解释和响应输入时,智能体就会出现。只要这是真的,有些智能体甚至不需要与外部工具交互或采取行动。在Menlo,我们确定了三种不同主要用例和应用程序进程控制自由度的智能体类型。受到最严格限制的是"决策智能体"设计,它们使用语言模型来遍历预定义的决策树。"轨道智能体"则提供了更大的自由度,为智能体配备了更高层次的目标,但同时限制了解决空间,要求遵循标准作业程序并使用预先设定的"工具"库。最后,在光谱的另一端是"通用人工智能体"——本质上是没有任何数据支架的for循环,完全依赖于语言模型的推理能力来进行所有的计划、反思和纠正。以下,我们将探讨五种参考架构和每种智能体类型的人工智能体示例。

问:AGI 的 5 个等级是什么?

OpenAI在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级。OpenAI自2015年成立以来,一直将AGI作为其战略目标之一,随着ChatGPT、多模态大模型和AI Agent等技术的发展,我们似乎越来越接近实现这一目标。AGI的五个等级分别为:1.聊天机器人(Chatbots):具备基本对话能力的AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。2.推理者(Reasoners):具备人类推理水平的AI,能够解决复杂问题,如ChatGPT,能够根据上下文和文件提供详细分析和意见。3.智能体(Agents):不仅具备推理能力,还能执行全自动化业务的AI。目前许多AI Agent产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。4.创新者(Innovators):能够协助人类完成新发明的AI,如谷歌DeepMind的AlphaFold模型,可以预测蛋白质结构,加速科学研究和新药发现。5.组织(Organizations):最高级别的AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。

Others are asking
现在的AI分几类
目前,AI 主要分为以下几类: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,包括规划、执行、反馈、迭代、资源分配和管理等。 此外,AI 还包括弱人工智能(ANI),如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等,这类 AI 只可做一件事。而通用人工智能(AGI)则是能够做任何人类可以做的事。
2024-12-01
AI一共有几类产品
AI 产品主要分为以下几类: To C 领域: 主打 AI 角色扮演赛道的产品,例如“猫箱”“剧本戏”“名人朋友圈”等,在 LLM 基础上,在 prompt 上加了些特定角色定义。 主打 AI 陪伴类的产品,例如“星野”“Talkie”“BubblePal”等,在 LLM 基础上,在 prompt 上加了些特定角色定义,且会在长短记忆上做出处理,以突出陪伴意义。 做 AI 搜索工具的产品,例如“秘塔”“360 搜索”等,有些会在搜索内容基础上,把内容结构化,整出一个图谱或者脑图。 单纯的做 AIGC 的产品,例如“可灵”“ai 写作手”“即梦”“md”等,借助 AI 的生成能力做出。 Agent 产品,目前只有头部的厂商在做,比如字节的扣子,支付宝的智能助理,百度的文心智能体,腾讯的元宝。 To B 领域: 智能办公,价值点主要体现在办公垂域场景中,比如快速总结群聊内容或会议信息,给出公文写作的结构模板参考等。 智能客服,通常借助 agent 来实现,接入企业的 QA 知识库,对用户的信息予以回应,并依据用户的回答下达诸如取消订单、催快递之类的 action 指令。 AI 导购,在用户和商家之间发挥作用,能够依据用户的问题,结合产品的介绍和评论信息等,为用户推荐更为准确、精准的产品。 智能营销。 此外,4 月动态中还提到了 78 个 AI 新产品,包括 15 个初创企业的新产品(从开源和闭源角度划分)、39 个有用的和 10 个好玩的新产品(有用的部分从通用场景及垂直场景划分,还单列了诸如模型训练、AI 安全、代码学习和 AI 代理等关注度较高的类别)、14 个大公司的新产品(如微软、谷歌、英伟达、苹果、Palantir 等)。
2024-08-26
coze搭建智能体,用上传的文件和知识库的文件做对比,分析差异点。
以下是关于在 Coze 中搭建智能体的相关信息: 1. 证件照相关操作: 展示原图上传结果,基本脸型已换,生成效果与上传照片特征有关。 改背景可利用改图功能,一键改图效果更好,输出数据类型为图片。 豆包节点生成的是 URL 地址,与前者不同,在工作流使用有差异,可参考简单提示词。 介绍证件照工作流相关操作,包括通过提示词改背景颜色,设置输出方式为返回变量;讲解消耗 token 及保存结果相关问题;对按钮、表单添加事件并设置参数,限制上传文件数量;还涉及给表单和图片绑定数据,以及每次操作后刷新界面确保设置生效。 围绕操作讲解与优化展开,介绍 for meet 的设置,如表单事件操作、图片上传数量修改等,提及编程基础知识。还讲述成果图连接、绑定数据方法及注意事项。展示基本功能实现情况,分析换性别等问题成因,指出需在工作流优化提示词,也可尝试用视频模型解决,最后进入问答环节。 2. 多维表格的高速数据分析: 创建智能体,使用单 Agent 对话流模式。 编排对话流,创建新的对话流并关联智能体。 使用代码节点对两个插件获取的结果进行数据处理,注意代码节点输出的配置格式。 测试,找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。 发布,选择多维表格,配置输出类型为文本,输入类型选择字段选择器,完善上架信息,可选择仅自己可用以加快审核。 3. 智能体与微信和微信群的连接: 创建知识库,可选择手动清洗数据提高准确性,包括在线知识库和本地文档。 在线知识库创建时,飞书在线文档中每个问题和答案以分割,可编辑修改和删除。 本地文档中注意拆分内容提高训练数据准确度,如将课程章节按固定方式人工标注和处理。 发布应用,确保在 Bot 商店中能够搜到。
2025-04-18
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
AI Agents(智能体)
AI 智能体(Agents)是人工智能领域中一个重要的概念: 1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
2025-04-15
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
什么是通用人工智能
通用人工智能(AGI)是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。 目前 AGI 还只是一个理论概念,没有任何 AI 系统能达到这种通用智能水平。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 常见名词解释: AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。
2025-04-15
AI模型可以分为什么类型
AI 模型主要可以分为以下类型: 1. 基础模型(Foundation model):在大量数据上训练,能适应多种任务,可作为构建更特定 AI 模型的基础。 2. 大语言模型(LLM):例如谷歌的 BERT 模型,可用于语义理解等任务,生成只是其处理任务之一。 3. 生成式 AI 模型:能够生成文本、图片、音频、视频等内容形式。 4. 按照学习方式分类: 监督学习模型:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习模型:处理无标签数据,自主发现规律,经典任务如聚类。 强化学习模型:从反馈中学习,以最大化奖励或最小化损失。 5. 深度学习模型:参照人脑神经网络和神经元,由于有很多层而被称为深度,神经网络可用于监督学习、无监督学习、强化学习。
2025-04-01
AI 分为哪些层?如:语料,大模型
AI 可以分为以下几个层面: 1. 概念层面: AI 即人工智能。 生成式 AI 生成的内容称为 AIGC。 2. 学习方式层面: 机器学习,包括监督学习(有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归)、无监督学习(学习的数据没有标签,算法自主发现规律,经典任务如聚类)、强化学习(从反馈里学习,最大化奖励或最小化损失,类似训小狗)。 3. 技术方法层面: 深度学习,参照人脑有神经网络和神经元(因有很多层所以叫深度),神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 即大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 4. 技术里程碑层面:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,无需依赖循环神经网络(RNN)或卷积神经网络(CNN)。
2025-03-30
ai的研究是否可以分为神经网络与知识图谱两个大的分类?
AI 的研究可以分为多个不同的分类,并非仅仅局限于神经网络与知识图谱这两个大的分类。 在常见的分类中: 非监督学习:最著名的是聚类,只需提供大量数据,让 AI 自行找出有趣信息。 迁移学习:在任务 A 中学习的内容可用于帮助完成任务 B,在计算机视觉领域有较多应用。 强化学习:根据输出好坏给予奖励或惩罚,利用“奖励信号”让 AI 自动学习最大化奖励,但需要大量数据。 生成对抗网络:由生成器和判别器构成,两者不断训练和竞争,提高生成真实数据的能力,广泛应用于多种领域。 此外,从技术和应用的角度来看: 知识图谱:在搜索等场景中展示关键信息,如人物相关信息、酒店信息等。 在企业中建构人工智能方面,NLG 可作为全新场景讨论,生成内容分为根据任务要求生成标准结果和根据信息进行内容创作两类,分别偏向 B 端和 C 端。NLP 能做的事情较标准化,LLM 的出现对其有提升和冲击。知识图谱领域本身有多种技术路径,与 LLM 可能是互补关系。 对于希望精进的学习者,还需要了解 AI 的背景知识,包括基础理论、历史发展、数学基础(统计学、线性代数、概率论),掌握算法和模型(监督学习、无监督学习、强化学习),学会评估和调优(性能评估、模型调优),以及神经网络基础(网络结构、激活函数)等。
2025-02-12
“美国红杉资本指出,AI 供应链分为六层”,展开说说这六层吧
美国红杉资本指出的 AI 供应链从下到上分为六层,具体情况如下: 1. 第一层是芯片代工厂(如台积电),保持着高利润水平。 2. 第二层是芯片设计商(如英伟达),同样具有高利润。 3. 第三层是工业能源供应商(如电力公司),因数据中心需求激增而受益。 4. 第四层是云厂商,处于重金投入阶段,不仅斥巨资建设数据中心,还在训练自有模型或大举投资 AI 模型开发商。 5. 第五层是 AI 模型开发商,目前面临亏损。 6. 第六层即最上层是面向最终客户的应用服务商,虽充满潜力,但依赖消费者和企业付费,当前市场规模有限,尚不足以支撑整个供应链的经济模型。
2024-12-05
帮我写一个可以训练的分类器代码, python 代码,目的是将样本的扰动分为 0,0.001,0.003,0.005 四类,按照以下步骤写 第一步:导入需要的库 第二步:加载位于/public/xdw/ls/signaldefense/AS/perturbed_data.npy 的数据 第三步:获取数据样本的扰动值 第四步:判断扰动值的大小,比如扰动值为 0,则加一计数 第五步:打印出判断各类扰动值的正确率
以下是为您生成的 Python 代码示例,用于实现将样本的扰动分为 0、0.001、0.003、0.005 四类的分类器: ```python import numpy as np 第一步:导入需要的库 import numpy as np 第二步:加载数据 data = np.load 第三步:获取数据样本的扰动值 perturbation_values = data 假设扰动值在第二列 第四步:判断扰动值的大小并计数 count_0 = 0 count_0_001 = 0 count_0_003 = 0 count_0_005 = 0 for value in perturbation_values: if value == 0: count_0 += 1 elif value == 0.001: count_0_001 += 1 elif value == 0.003: count_0_003 += 1 elif value == 0.005: count_0_005 += 1 第五步:计算正确率 total_samples = len accuracy_0 = count_0 / total_samples accuracy_0_001 = count_0_001 / total_samples accuracy_0_003 = count_0_003 / total_samples accuracy_0_005 = count_0_005 / total_samples print print print print ```
2024-12-05
提示词分为哪几种?如提问式、指示式等
提示词主要分为以下几种: 1. 头脑风暴类: Brainwriting Prompt:通过写下尽可能多的想法来为特定主题进行头脑风暴。 Reverse Brainstorming Prompt:通过提出故意不好的想法来激发创造力。 Mind Mapping Prompt:为特定主题创建完整的思维导图。 Assumptions Prompt:列出关于特定主题的假设,并挑战这些假设以产生创新想法。 SWOT Analysis Prompt:对特定主题进行 SWOT 分析。 SCAMPER Prompt:使用 SCAMPER 检查表来构思。 Six Thinking Hats Prompt:使用六顶思考帽方法从不同角度构思。 Worst Possible Idea Prompt:为特定主题头脑风暴故意糟糕的想法。 Trigger Words Prompt:利用随机单词触发与特定主题相关的新想法。 Questioning Prompt:生成关于特定主题的问题,并将其转化为想法。 Rolestorming Prompt:从特定角色的角度进行构思。 2. 通用类: 以问题或指示的形式出现,例如简单的问题、详细的描述或特定的任务。在生成式人工智能模型中,它可以引导模型产生期望的输出。 通常包含指令、问题、输入数据和示例。为了从 AI 模型中得到期望的回应,提示词必须包含指令或问题,其他元素则是可选的。 基本的提示词可以简单到直接提问或提供特定任务的指令,高级提示词则涉及更复杂的结构,如“思维链”提示词,引导模型遵循逻辑推理过程来得出答案。
2024-08-28