Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI agt 是很么概念

Answer

AI Agent 是一种智能代理系统,具有以下特点和概念:

  • 是从年前到现在比较火的概念,被认为是大模型未来的主要发展方向。
  • 中间的“智能体”通常是 LLM 或大模型,通过为其增加工具、记忆、行动、规划这四个能力来实现。
  • 目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。
  • 准确来说,指的是一种智能代理系统,接近人类大脑,可形成记忆、达成行动规划、自动交互、主动预测。
  • 目前其概念在市场上未达成共识,存在被滥用现象。
  • 应用特点包括个性化,能随着用户使用了解用户习惯和想法并作出喜好预测;能自主完成任务,如 Auto GPT 可在用户输入目标后自主执行任务、递归开发和调试代码;能实现多 Agent 协作,如斯坦福大学的 SmallVille 项目。
  • 应用大多集中在 2B 场景,面向个人消费者的产品少。
  • 包括 Chain(通常一个 AI Agent 可能由多个 Chain 组成)、Router(可使用判定让 Agent 走向不同的 Chain)、Tool(Agent 上的一次工具调用)等概念。
  • 例如微信虚拟女友中的 AI Agent 包括 Responser Agent(主 agent,用于回复用户)、Background Agent(背景 agent,用于推进角色当前状态)、Daily Agent(用于生成剧本、配套图片和每日朋友圈)。
Content generated by AI large model, please carefully verify (powered by aily)

References

非技术背景,一文读懂大模型(长文)

agent算是从年前到现在,比较火的一个概念了,也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的,然后市面上的很多描述agent的文章写的也比较复杂,说智能体是啥智能的最小单元,相较于copilot,是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错,但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下,agent是个什么东西。首先这张图里,中间的“智能体”,其实就是llm,或者说大模型。四个箭头,分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢?目前行业里主要用到的是一个叫langchain的框架,这个框架可以简单理解为,他把llm和llm之间,以及llm和工具之间,通过代码或prompt的形式,进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛,那agent,其实就是给了大模型更多的工具。比如像是长期记忆,其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动,其实就是在大模型的prompt层做的些逻辑,比如让其将目标进行每一步的拆解,拆解完成后,每一步去输出不同的固定格式action指令,给到工具作为输入。当然langchain或者说agent还不止这些,也会有很多其他的代码逻辑体现在其中,不过其主要的主干逻辑,其实还是在prompt层和工具层,完成的设计。

GPTs 、中间层、Chatbot虚拟社交、AI Agent, 大模型应用最新方向解析

准确的来说,AI Agent指的是一种智能代理系统,它接近人类的大脑,可形成记忆、达成行动规划、自动交互、主动预测。目前AI Agent的概念在市场上并没有达成共识,存在被广泛滥用的现象。(很多Chatbot应用给Bot冠以“智能体”的名称,准确的说是对Agent的误用)[heading3]AI Agent应用的特点:[content]个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测Dot App在对话中了解用户喜好,随后为用户推荐新的咖啡店自主完成任务:Auto GPT:用户输入一个目标后,可自主执行任务、递归地开发和调试代码多Agent协作斯坦福大学的SmallVille(小镇)项目,现已开源25个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活Fixie AI在收到用户请求后启动多个负责不同模块的Agent进行数据查询和传递,最终生成邮件内容给客户回复博主林亦LYi的《AI炒股?我开了一家员工全是AI的公司,自动帮我炒股》就在某种程度上实现了多Agent协作的能力:目前,AI Agent应用大多集中在2B场景,面向个人消费者的产品少之又少。一方面是高度智能化的Agent能力需要打磨,概念落地还有较长一段距离;一方面是AI和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。

皮皮:你的微信虚拟女友 - 李洛云

AI Agent:基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。AI Agent包括下面几个概念:Chain:通常一个AI Agent可能由多个Chain组成。一个Chain视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的Chain是大语言模型完成的LLM Chain。Router:我们可以使用一些判定(甚至可以用LLM来判定),然后让Agent走向不同的Chain。例如:如果这是一个图片,则a;否则b。Tool:Agent上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。总结下来我们需要三个Agent:Responser Agent:主agent,用于回复用户(伪多模态)Background Agent:背景agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)Daily Agent:每日agent,用于生成剧本,配套的图片,以及每日朋友圈Responser AgentDaily AgentBackground Agent每隔一段时间运行一次(默认3分钟)分析期间的历史对话变更人物关系(亲密度,了解度等)变更反感度,如果超标则拉黑用户抽简对话内容,提取人物和用户的信息成为“增长的记忆体”按照时间推进人物剧本有概率主动聊天(与亲密度正相关,跳过夜间时间)[heading1]复杂的东西:中期记忆中的增长记忆体

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
准确的讲述垂直大模型的概念,国内外的应用现状、场景,发展趋势,最好能附带图片。内容尽量详细、逻辑通顺。
垂直大模型是专注于特定领域的大模型,例如小语种交流、临床医学、AI 蛋白质结构预测等。 在国内,大模型分为通用模型如文心一言、讯飞星火等,处理自然语言;也有垂直模型专注特定领域。 大模型因其强大的语言理解和生成能力,在多个领域和应用场景中表现出色。比较火的应用场景包括: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可以根据文本描述生成相应的图像,甚至在未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务的门槛。 关于发展趋势,尽管当前市场以基础大模型为主,但将大模型与行业专业知识结合,以满足不同行业的需求,成为未来发展的关键。例如腾讯研究院的《行业大模型调研报告》指出,如何将大模型与行业专业知识结合是重点。同时,在发展过程中也需要注意其在隐私、安全和伦理方面的挑战。 很抱歉,暂时无法为您提供相关图片。
2025-04-11
用文生图来画插画风格的系统流程图、概念图有哪些快速上手的prompt、平台和教程
以下是关于用文生图来画插画风格的系统流程图、概念图的快速上手的 prompt、平台和教程: 平台:Tusiart Prompt 提示词: 用英文写您想要 AI 生成的内容,不用管语法,仅使用单词和短语的组合去表达需求,单词、短语之间用英文半角逗号隔开。 描述逻辑通常包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。 教程: 1. 定主题:确定您需要生成的图的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:按照主题找内容贴近的 checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:在生成内容基础上,寻找内容重叠的 lora 以控制图片效果及质量。 4. ControlNet:可控制图片中特定图像,如人物姿态、特定文字等,高阶技能可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. 负向提示词 Negative Prompt:用英文写您想要 AI 避免产生的内容,单词和短语组合,中间用英文半角逗号隔开。 8. 采样算法:一般选 DPM++2M Karras,也可留意 checkpoint 详情页上模型作者推荐的采样器。 9. 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 10. 尺寸:根据喜好和需求选择。 辅助网站: 1. http://www.atoolbox.net/ :通过选项卡方式快速填写关键词信息。 2. https://ai.dawnmark.cn/ :每种参数有缩略图参考,更直观选择提示词。 3. https://civitai.com/ :可抄作业,复制图片的详细参数用于生成。 下次作图时,可先选择模板,点击倒数第二个按钮快速输入标准提示词。
2025-03-28
NLP相关概念
以下是关于 NLP 相关概念的详细介绍: 一、NLP、NLU、NLG 的关系 自然语言处理(NLP)中包含了自然语言理解(NLU)和自然语言生成(NLG)。 二、NLP 的定义 自然语言处理(Natural Language Processing,NLP)是研究人与计算机之间使用自然语言进行有效通信,希望机器能像人一样具备正常人的语言理解能力。有别于计算机语言,“自然语言”是人类发展过程中形成的一种信息交流方式,包括汉语、英语、法语等世界上所有的语种语言。“处理”包含理解、转化、生成等过程。“自然语言处理”就是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工,以实现人机间的信息交流。 三、NLP 的用途 如文字校对、信息检索、机器翻译、问答系统、聊天机器人、文章摘要、舆情监测、情绪分析等都涉及到 NLP 相关技术。 四、NLP 的技术原理 按照内容构成的层次,NLP 的基本技术原理可以分成 5 个层次: 1. 词法分析:找到词汇的各个词素,从中获得语言学信息。 2. 句法分析:对句子和短语的结构进行分析,目的是要找出词、短语等的相互关系以及各自在句中的作用。 3. 语义分析:找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念。 4. 篇章分析:分析篇章结构,识别不同部分之间的语义联系,结合内外部信息,在整体上理解篇章。 5. 内容生成 五、NLU 专注于让计算机理解人类语言的含义。NLU 系统试图理解句子和词语背后的含义,而不是仅仅处理单个词语。NLU 能够识别文本中的情感、意图和实体,并将其转化为计算机可以理解的结构化信息。 六、NLG 专注于让计算机生成人类可以理解的语言。NLG 系统将结构化数据转化为自然语言文本,例如新闻报道、产品描述、聊天机器人回复等。NLG 能够根据不同的需求和场景,生成不同风格和语气的文本。 七、NLP 任务 主要包含 3 大类任务: 1. 自然语言理解任务(NLU,Natural Language Understanding):特点是能看到完整上下文信息,然后做广义分类任务,典型任务如文本情感分析,词性标注,信息检索等。 2. 有条件自然语言生成任务(conditionedNLG,Natural Language Generation):特点是 seq2seq,典型任务例如机器翻译,自动摘要等。 3. 无条件自然语言生成任务(unconditionedNLG):特点是开放性的句子生成,典型任务如问答系统(QA)、对话机器人(ChatBot)等。一开始针对不同任务会使用不同的模型,后来发现 NLG 任务能通过 incontext learning + prompt 来完成 NLU 任务,于是逐渐收敛到了 NLG 任务。
2025-03-24
介绍AI基本概念和目前发展阶段
AI 的基本概念: 人工智能(AI)是指让计算机模拟人类智能的技术。 主要分支包括机器学习、深度学习、自然语言处理等,它们之间存在密切联系。 目前发展阶段: 已取得显著进展,如聊天机器人具备基本对话能力,能用于客户服务和简单查询响应。 推理者如 ChatGPT 能解决复杂问题并提供详细分析和意见。 智能体虽能执行部分自动化业务,但仍需人类参与。 创新者如谷歌 DeepMind 的 AlphaFold 模型能协助人类完成新发明。 最高级别的组织型 AI 能自动执行组织的全部业务流程,但尚未完全实现。 对于新手学习 AI: 建议阅读「」熟悉术语和基础概念。 浏览入门文章了解历史、应用和发展趋势。 在「」中找到初学者课程,特别推荐李宏毅老师的课程。 通过在线教育平台按自己节奏学习并获取证书。 根据兴趣选择特定模块深入学习,掌握提示词技巧。 理论学习后进行实践,尝试使用各种产品并分享实践成果。 体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人。 如果希望继续精进 AI: 了解 AI 背景知识,包括基础理论、历史发展。 掌握数学基础,如统计学、线性代数、概率论。 熟悉算法和模型,如监督学习、无监督学习、强化学习。 学会评估和调优模型性能。 了解神经网络基础,包括网络结构和激活函数。
2025-03-20
描述相关概念的时候需要给ai什么指令
以下是关于给 AI 描述相关概念时的一些指令示例: 在法律法规方面,如《人工智能法案》中,指令包括发布年度报告以评估法规实施情况、审查严重事件报告、协助建立监管沙箱、组织与相关机构的会议和咨询等。 对于 Midjourney 生成 UI 界面,若指定生成某个页面(如首页、登录页等),可添加页面指令描述,如“landing page”“Profile Page”等。对于社交平台,关键词“landing page”可生成社交平台的登录页设计;对于信息类,关键词“Profile Page”可生成人力资源类产品的个人资料页。 需要注意的是,目前 Midjourney 产出的设计图更适合在 APP 设计的初始阶段提供灵感和创意,直接落地开发仍有距离,但随着 AI 技术的迭代,这种距离有望缩短。
2025-03-16
我在用AI辅助学习新概念英语第二册,但是deep seek总是报错,我应该换成什么别的AI呢?
如果您在使用 Deep Seek 辅助学习新概念英语第二册时总是报错,可以考虑换成 Wenxiaobai.com 这个平台。它高速响应,完全免费,支持各种平台使用,与 Deep Seek 官网几乎相同,速度快且稳定性高,最新版本还支持文档与图片分析。
2025-03-12