Navigate to WaytoAGI Wiki →
Home/All Questions
什么是AI Agent
AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 它包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 同时,AI Agent 还需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 3. Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 此外,心灵社会理论认为,智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,从低层次的感知和反应到高层次的规划和决策,每个层次由多个 Agent 负责。每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务,如视觉处理、语言理解、运动控制等。智能不是集中在单一的核心处理单元,而是通过多个相互关联的 Agent 共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性,应对复杂和多变的环境。同时,在《心灵社会》中,明斯基还详细描述了不同类型的 Agent 及其功能,如专家 Agent、管理 Agent、学习 Agent 等。 AI Agent 是一个融合了语言学、心理学、神经学、逻辑学、社会科学、计算机科学等多个学科精髓的综合实体。它不仅拥有实体形态,更蕴含着丰富的概念形态,同时它还具备了许多人类特有的属性。因为这些学科大多以人为研究对象,致力于探索人类内在的本质。
2025-03-13
撰写lisp语法风格提示词的教程
以下是一份关于 Lisp 语法风格提示词的教程: Lisp 是一门“古老”的编程语言,其语法核心是 List 结构,也叫“S 表达式”,典型特征是用一对括号把元素括起来,并且 List 结构里可以嵌套 List,使得程序呈现出多层括号嵌套的样子。Lisp 语法简洁且优美,具有很强的表达能力。 在提示词编程方面,李继刚写的提示词有用 Lisp 语言编写的例子。用 Lisp 写提示词具有一些特点和优势: 1. SVG 图形的丰富度和表现力可能优于 Markdown 版本。 2. 执行过程会输出中间“思考”过程,方便调试优化流程,能看到哪些步骤生成有用信息,哪些无用,还可能从中获得新灵感。 但平时写提示词用的更多的是 Markdown 语法,它简单且大语言模型能很好“理解”。对比两者,在多数场景下,从文本处理后的输出结果可能看不出太大差异,但逐步思考有正向收益。 在“情绪价值营销”中,可以用 Lisp 构建 prompt,让 Claude 直接根据用户输入输出情绪营销语句。用 Lisp 这种编程语言在 prompt 圈曾被带火,其更为凝练和简洁。当然,用 Markdown 格式写 prompt 效果也一样。 使用 Lisp 格式 prompt 时(Claude 专用),需要注意一些事项。例如,对于 GPT 等模型在卡片生成这步需要进行一些调整,不稳定,最好自定义 html/css 样式来进行强约束。使用时,直接打开 Claude 首页,发送上述提示词进行初始化,然后即可使用。
2025-03-13
动漫脸部修复
以下是关于动漫脸部修复的相关内容: GFPGAN 面部修复: 找一张模糊人像进行修复,其他参数不变,直接将 GFPGAN 参数拉到 1 即可。面部修复效果显著,但只能修复脸部,头发、衣服、背景等无变化。 背景去除: 需要安装插件 REMBG,安装地址是 https://github.com/AUTOMATIC1111/stablediffusionwebuirembg.git 。安装好之后重启,就有选项框。 测试时模型选第一个 u2net,直接点击生成。抠图效果不错但边缘轮廓可能有黑边,用时 2.86 秒。 去掉黑边可点击后面的 Alpha matting 调整参数,如 Erode size:6、Foreground threshold:143、Background threshold:187,就能得到无黑边图像。 点击按钮还可直接生成蒙版。有专门做服装抠图和动漫抠图的模型。 手部修复: 对于动漫人物手部修复,先在 3D 骨架模型编辑器中手动调整还原骨架,若为写实人物可使用 openpose 预处理器进行姿态检测。 来到深度图库,修改尺寸并载入骨架图,选择合适手势添加,可发送到 controlnet。 启用 controlnet 时选择相应预处理器,在图生图中进行手部局部重绘,绘制蒙版,可一只手一只手调整,之后在 ps 中使用“创成式填充”修补衔接区域。 SD 新手入门图文教程中的相关内容: 放大算法中,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 效果不佳,ESRGAN_4x、SwinR 4x 对 0.5 以下重绘幅度支持较好。 Hires step 表示进行这一步时计算的步数。 Denoising strength 表现为生成图片对原始输入图像内容的变化程度,一般阈值 0.7 左右,超过 0.7 与原图基本无关,0.3 以下稍作修改。 面部修复可修复人物面部,但非写实风格人物开启可能导致面部崩坏。
2025-03-13
脸部修复
以下是关于脸部修复的相关内容: 在 Stable Diffusion 中,通常初始分辨率设为 512x512 以提高抽卡效率,但这样人脸易崩。确定人物姿态和构图后,可点击面部修复和高分辨率修复达到正常效果,但小图和大图存在差异,重绘幅度低无法修复细节错误,高则会导致人物发型、服装变化大。 GFPGAN 面部修复:其他参数不变,直接将 GFPGAN 参数拉到 1 即可。此功能只能修复脸部,头发、衣服、背景等无变化。 背景去除:需安装插件 REMBG,安装地址是 https://github.com/AUTOMATIC1111/stablediffusionwebuirembg.git 。安装好后重启,有选项框,模型选第一个 u2net 点击生成。抠图效果不错但有黑边,可通过点击 Alpha matting 调整参数(Erode size:6、Foreground threshold:143、Background threshold:187)去掉黑边,还能生成蒙版。有专门做服装和动漫抠图的模型。 脸部修复插件 After Detailer:安装方式可在扩展面板中搜索直接安装,或放在“……\\sdwebuiakiv4\\extensions”路径文件夹下。安装完成重启 webUI 会出现插件面板。使用时在启用“After Detailer”前打勾,下拉菜单中有很多模型,分别针对 2D 人物的脸、手、全身和真实人物的脸部修复。选择真人脸部模型,关掉“面部修复”和“高分辨率修复”,保持 512x512 尺寸测试,人物脸部正常,细节精致。插件有正负提示词输入框,输入表情相关文字人物表情会改变,如输入“伤心、流泪”,但输入“带着墨镜”无变化,提示词仅针对表情。插件的第二单元和 controlnet 一样有多通道,将第二单元模型换成 hand 模型可修复手部,但效果有待改善,可结合 PS 蒙版处理。
2025-03-13
有没有什么好用的搜索引擎
以下是一些好用的 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户的搜索效率和体验。 2. Perplexity:聊天机器人式的搜索引擎,允许用自然语言提问,通过生成式 AI 技术从各种来源收集信息并给出答案。它不仅有通用搜索功能,还推出了 Copilot 能力,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。网页版能力全面,能根据提问从互联网上搜寻信息并给出总结后的答案,还能给出信息来源网址,并根据搜索内容给出继续对话的问题建议。但要注意不要在开着浏览器翻译能力的同时使用,可能会报错。此外,首页推荐当下流行的新闻、搜索内容,支持筛选 Academic、Wolfram|Alpha、Wikipedia、Youtube、Reddit、News 进行搜索。访问地址: 3. 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,提供插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关的搜索结果和动态答案,特别擅长处理编程和技术问题。 这些 AI 搜索引擎通过不同的技术和功能,为用户提供更加精准、高效和个性化的搜索体验。
2025-03-13
生成卡片的prompt
以下是关于生成卡片的 prompt 相关内容: 甲木:如何让 Claude 帮您做“古诗词卡片” 主题和方向决定超级符合诗词原意调性的古诗词名片。 流程:输入 prompt,用户输入主题、风格,AI 输出最终结果。 已开源提示词,获取方式:关注、点赞、转发。 有第一版规定 AI 排版、固定输出和第二版释放 AI 创意、自由发挥两种版本。 这款 AI 浏览器插件: 目标是输入任意文章链接后,AI 自动生成适合微信分享的文章推荐卡片。 关键步骤包括网页爬取、内容总结、二维码生成、卡片样式生成。 编写“网页分享卡片生成”词生卡 Prompt,将设计要求拆分为“设计规范”和“内容结构”,细分为多个独立模块,具有模型通用性、提示简易性、生成稳定性等优势。 李继刚:用 Claude 做卡片 欢迎评论区贴测试效果。 相关直播分享和公众号链接。 用 Claude 制作生成记忆卡片和创新概念解释器。 写 prompt 过程中可能感到词汇量、审美能力、抽象能力不足。 操作说明:使用 Claude 输入 prompt 后再输入要解释的内容,若样式不满意可重新开窗口或修改刷新 prompt 找到好看风格。 分享了画 SVG 图的 Prompt,效果惊艳。
2025-03-13
在开会时实现AI识别语音成文档
目前在开会时实现 AI 识别语音成文档的技术已经较为成熟。常见的实现方式有使用专门的语音识别软件或服务,例如科大讯飞、百度语音等。这些工具通常可以实时将会议中的语音转换为文字,并生成相应的文档。在使用时,需要确保有良好的录音设备以获取清晰的语音输入,同时要注意对识别结果进行适当的校对和修正,以提高文档的准确性。
2025-03-13
我正在找工作,需要写简历和准备面试,什么AI软件可以对我现在的情况起到辅助作用呢?
以下是一些可以在您找工作写简历和准备面试时提供辅助的 AI 软件: 1. 写简历方面: Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 2. 面试准备方面: Applicant AI:人工智能面试系统,通过 AI 视频聊天快速筛选求职者,匹配招聘标准,自动推送合适候选人至下一阶段,减少人工干预,可安排面试流程,提高招聘效率。 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障,能帮助企业完成面试,借助人岗匹配模型,自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 InterviewAI:在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 需要注意的是,使用这些产品时,要考虑到数据安全性和隐私保护的问题。
2025-03-13
你帮我找找能够生成提示词的提示词,不要是那个ai会话的,是文本生成的
以下是一些关于生成文本生成提示词的相关信息: OpenAI API 可应用于多种自然语言、代码或图像生成任务,提供不同能力级别的模型,可微调自定义模型,模型通过将文本分解为标记(Token)来理解和处理文本。 设计提示词本质上是对模型进行“编程”,可通过提供指令或示例完成,适用于内容或代码生成、摘要、扩展、对话、创意写作、风格转换等任务。 在 OpenAI Playground 中,有可选的模型、提示词结构、温度等参数。提示词结构区分了 SYSTEM 和 USER 对话框,SYSTEM 可用于控制角色设定。温度控制生成文本的随机性,取值 0 到 2 之间,0 时结果确定无聊,过高则可能输出乱码。 关于生成提示词的工具,推荐顺序为 chatGPT 4.0、kimichat、智谱清言 4 等。对于文本纠错,可使用飞书文档自带纠错功能或通过 prompt 让大模型检查并改正。对于国产大模型,智谱和文心等可以文生图。
2025-03-13
你帮我找一找能够生成提示词的提示词!
以下是为您找到的一些能够生成提示词的相关内容: 1. Midjourney 提示词生成器:仿照 GPTs 里的 MJ prompt 改了一版提示词,可用于 coze 或其他国内的 agent。方便之处在于若提示词懒得写全,可让 agent 补全润色,粘贴即可。例如“一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格”等。 2. 【SD】自动写提示词脚本 One Button Prompt:在插件下方可添加提示词增加控制,如规定所画必须是猫或标准化质量提示词。设定主题如“人物”“风景”等,在“工作流协助”中点击“生成一些提示词”,会随机生成多段提示词,可任选发送到上方生成,还能对提示词修改调整。 3. 在对文心一言 4.0、智谱清言、KimiChat 等的小样本测评中,设置了让模型生成能根据用户需求写出合适的 RPG 游戏策划(包括角色、剧情、玩法和场景等内容)的提示词的任务。
2025-03-13