AI Agent 被认为是大模型未来的主要发展方向之一,其发展具有以下特点和阶段:
近期出现的各类 AI 搜索引擎不断颠覆传统搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等。AI Agent 在辅助高效处理信息和简便信息表达方面表现出色,例如智能摘要能辅助快速筛选信息,自然语言描述可生成美观可用的图片。在工作流方面,每个人应根据自身情况找到适合的工具,如产品经理可使用 AI 进行用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。关于 AI Agent 的未来,曾被认为异想天开的想法都可能成为现实,技术迭代会不断向前。
agent算是从年前到现在,比较火的一个概念了,也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的,然后市面上的很多描述agent的文章写的也比较复杂,说智能体是啥智能的最小单元,相较于copilot,是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错,但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下,agent是个什么东西。首先这张图里,中间的“智能体”,其实就是llm,或者说大模型。四个箭头,分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢?目前行业里主要用到的是一个叫langchain的框架,这个框架可以简单理解为,他把llm和llm之间,以及llm和工具之间,通过代码或prompt的形式,进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛,那agent,其实就是给了大模型更多的工具。比如像是长期记忆,其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动,其实就是在大模型的prompt层做的些逻辑,比如让其将目标进行每一步的拆解,拆解完成后,每一步去输出不同的固定格式action指令,给到工具作为输入。当然langchain或者说agent还不止这些,也会有很多其他的代码逻辑体现在其中,不过其主要的主干逻辑,其实还是在prompt层和工具层,完成的设计。
近期出现的各类AI搜索引擎,类似perplexity.ai、metaso、360搜索、ThinkAny等等,都是在不断颠覆传统的搜索引擎。辅助高效的处理信息阅读完一份10万字的PDF研究报告需要多久?这份报告主要讲了什么内容?有没有我要关注的点?智能摘要是目前我用的超顺手的一个功能,能够辅助我快速的筛选信息,什么值得看,什么不容错过,真正的实现信息的降噪。信息表达更简便放在以往很难想象,如果要实现下面这俩张图,可能会设计一系列的思考、草稿、理清逻辑等等流程。现在用自然语言描述一句话就给你生成了这样美观可用的图片,极大的降低了不同角色的创作门槛和周期,是真的简便。那么新型的产品设计方式也就出现了,在我原来的工作流中,我作为一名产品经理,我会开始使用AI去重新构建我的工作流:使用AI进行搞定用户画像、使用AI进行竞品调研、使用AI设计产品测试用例、使用AI绘制产品功能流程图...真的太多了。虽然我也推荐了一些我自己的工作流上使用的产品,但是我比较建议的是:每个人都是独特的个体,应该先摸清楚自己的日常工作流是怎么样的,然后通过每一个工作节点线索,去找到适合你自己使用的工具。就好比,我现在初出茅庐,手上握着+1攻击力的武器,+1的防御装备,这不影响我去打怪升级这个事情,假如你找到了一件合适自己的武器,它可能是+1000攻击力,你换上就好了,是能够快速的在你原来的这套工作流里进行战力升级。关于Agent的未来,我只想说:曾被认为的异想天开的想法,都可能会是AI Agent的未来。AI Agent我们其实可以理解为一个技术浪潮中不断前进的新名词,而技术迭代会不断向前。
尽管许多先驱为“AI Agent”这一概念奠定了基础并不断完善,但我们今天所见的AI Agent并非一蹴而就。简而言之,AI Agent的发展可以分为以下几个阶段。同时这些阶段也深深受到符号主义、连接主义、行为主义的影响。[heading3]9.1 Symbolic Agent[content]在人工智能的黎明时期,符号人工智能作为主导范式,以其对符号逻辑的依赖而著称。这种方法运用逻辑规则和符号表示,将知识封装于精确的框架之中,推动了推理过程的发展。它专注于两个核心议题:知识的表示与推理的转换。这些Symbolic Agent的设计宗旨是仿效人类的思考方式,构建了一套清晰、可解释的推理体系,其符号化的本质赋予了它们强大的表达力。符号人工智能的代表之作,是基于知识的专家系统,它们在特定领域内展现出了卓越的推理能力。然而,Symbolic Agent在处理现实世界的不确定性和复杂性时,却遭遇了难以逾越的障碍。此外,符号推理算法本身的复杂性,使得寻找一种既高效又能在有限时间内产生有意义结果的算法,成为了一项艰巨的挑战。时间:20世纪50-70年代特点:基于逻辑和规则系统,使用符号来表示知识,通过符号操作进行推理技术:基于规则的系统,专家系统,如MYCIN,XCON等优点:明确的推理过程,可解释性强缺点:知识获取困难,缺乏常识,难以处理模糊性