Navigate to WaytoAGI Wiki →
Home/All Questions
智能体API
智能体 API 相关内容如下: 在扣子平台上,插件就像一个工具箱,里面可以放一个或者好几个工具,这些工具被称为 API。目前扣子平台已有多种类型的插件,如看新闻、规划旅行、提高办公效率、理解图片内容的 API,以及能处理多种任务的模型。若现有的插件不符合需求,还可自行制作插件并加入所需 API。 多智能体 AI 搜索引擎方案中,第一步需根据用户任务使用搜索工具 API WebSearchPro 补充信息,参考文档为 https://bigmodel.cn/dev/api/searchtool/websearchpro 。第二步用大模型如 GLM40520 规划和分解子任务,并转换为 JSON 格式,参考 API 文档 https://bigmodel.cn/dev/api/normalmodel/glm4 和 JSON 工具 https://bigmodel.cn/dev/howuse/jsonformat 。第三步通过 AI 搜索智能体完成子任务,其调用方式参考文档 https://bigmodel.cn/dev/api/qingyanassistant/assistantapi ,智能体 id 为 659e54b1b8006379b4b2abd6 。第四步总结子任务生成思维导图,智能体调用方式参考文档 https://bigmodel.cn/dev/api/qingyanassistant/assistantapi ,智能体 id 为 664e0cade018d633146de0d2 。 让 Coze 智能体机器人连上微信和微信群时,需在扣子官网左下角选择扣子 API ,在 API 令牌中添加新令牌,设置名称、过期时间、选择指定团队空间和权限,并保存好令牌的 Token 。获取机器人 ID 时,在个人空间中找到要接入微信的机器人,如“画小二智能小助手”,其 Bot ID 在浏览器地址栏的 bot/之后。然后进行 API 授权,点击右上角发布,勾选 Bot as API 并确定应用已成功授权。
2025-03-06
如何用AI辅助做一款App
以下是用 AI 辅助做一款 App 的相关指导: 1. 在网站上增加一个 AI 助手: 创建大模型问答应用: 进入百炼控制台的,在页面右侧点击新增应用。在对话框,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认。您也可以选择输入一些 Prompt,比如设置一些人设以引导大模型更好的应对客户咨询。 在页面右侧可以提问验证模型效果。不过您会发现,目前它还无法准确回答你们公司的商品信息。点击右上角的发布,我们将在后面的步骤中去解决这一问题。 获取调用 API 所需的凭证: 在我的应用>应用列表中可以查看所有百炼应用 ID。保存应用 ID 到本地用于后续配置。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面。在页面右侧,点击创建我的 APIKEY,在弹出窗口中创建一个新 APIKEY。保存 APIKEY 到本地用于后续配置。 2. 用 AI 写出漂亮炫酷的应用的技巧: 不用非得用语言来描述想要的界面样式,可以去一些设计平台找喜欢的设计稿将图片上传让模型参考。国内推荐站酷、海外推荐 Dribbble 和 Layers。在跟 Claude 说的时候重点描述静态图片无法表现的部分。 可以要求 Claude 生成界面时引用在线的图片来填充到页面需要图片的部分,推荐 unsplash 这个开源图片网站。 要求 Claude 在生成页面的时候引用在线的图标库,比如 Font Awesome 或 Material Icons 这些开源图标库。 常用的前端样式代码是用 CSS 写的,但 CSS 本身的一些样式没太考虑美观度要求。 3. AI 时代创业的相关经验: Eric Quan 作为 AI IDE 的深度用户,发现 AI 会钻牛角尖,追问会给出离谱答复,还会不懂装懂给出错误知识。 解决模型幻觉问题的技巧:新建一个窗口;告诉 AI 忘掉之前所有内容,重新聊或新建会话窗口重新提问;告诉 AI 退一步,重新审视整个结构,设想从零开始如何设计;当 Claude 边猜边修改问题时,告诉它不确定就看日志并粘贴给它。一般借助这三个技巧引导 AI。或许真正的程序员把 Trae 当作辅助工具,但对 Eric Quan 来说,他是 AI 的辅助,只需告诉 Trae 想要什么,由它们来实现。
2025-03-06
ai绘画
AI 绘画具有多方面的特点和影响: 1. 与艺术界的双向影响: 改变传统艺术面貌:从生成艺术作品到辅助艺术创作,影响创作方式、审美观念和市场需求。 技术进步:从早期机械臂机器人到当前大语言模型,在创作质量和速度上有新突破,推动传统艺术数字化和普及化。 引发讨论和争议:人们对 AI 创作的艺术品接受程度与人类作品大致相同,但不太愿意将其视为艺术家;艺术家态度复杂,有期待也有担忧;带来从业者职业安全焦虑和“侵权”反对之声,挑战现有法律和伦理框架。 提供新可能性:帮助艺术家探索新创意表达方式,提高制作效率,降低成本,促进艺术与观众互动,提供个性化体验。 2. 关键词指南: 公式:主题+环境+气氛+灯光+色彩+构图+风格参考。 比如:将喜欢的艺术家、灯光、颜色等风格放入相应的关键词里。 3. 艺术与科技的融合: 呈现奇妙景象:将艺术与先进技术完美结合,引领艺术界走向未来。 探索之旅:利用机器学习和深度学习模拟创作过程,生成令人惊叹的作品,为艺术家提供新工具和观众带来新体验。 打破局限:不再局限于传统手工绘画技巧,通过技术手段开拓新创作领域,为缺乏绘画技巧的人提供参与机会,使艺术更民主化和包容。
2025-03-06
ComfyUI只能在N卡使用?可以在A卡上使用吗
ComfyUI 对电脑硬件有一定要求: 系统:Windows 7 以上。 显卡:推荐使用 NVIDIA 独立显卡且显存至少 4G 起步。不过,mac 系统、AMD 显卡以及低显卡的情况也可以安装使用,但可能存在功能不全、出错率偏高的问题,严重影响使用体验,建议升级设备或者采用云服务器玩耍。 硬盘:留有足够的空间,最低 100G 起步(包括模型)。 运行内存:最低 32GB,越高越好,最低配会经常爆显存。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。 甚至没有 GPU,光用 CPU 也可以运行,缺点是速度极慢。 综上所述,ComfyUI 虽然在某些情况下 A 卡也能安装使用,但使用体验可能不佳,一般建议使用 N 卡。
2025-03-06
ComfyUI是什么
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,具有以下特点: 简介:可以想象成集成了 stable diffusion 功能的 substance designer,通过将 stable diffusion 的流程拆分成节点,实现更加精准的工作流定制和完善的可复现性。 优劣势: 优势:对显存要求相对较低,启动速度快,出图速度快;具有更高的生成自由度;可以和 webui 共享环境和模型;可以搭建自己的工作流程,可以导出流程并分享给别人,报错的时候也能清晰的发现错误出在哪一步;生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势:操作门槛高,需要有清晰的逻辑;生态没有 webui 多(常用的都有),也有一些针对 Comfyui 开发的有趣插件。 官方链接:从 github 上下载作者部署好环境和依赖的整合包,按照官方文档按照即可:https://github.com/comfyanonymous/ComfyUI 生图原理: Pixel Space(像素空间):图的左边表示输入图像的像素空间,在 ComfyUI 中,这个对应于你可能通过“图像输入”模块或直接从文本提示生成的随机噪声图像。在生成过程结束时,系统会将处理后的潜在表示转换回像素空间,生成最终的图像。 Latent Space(潜在空间):ComfyUI 中的应用:ComfyUI 的许多操作都在潜在空间中进行,如 KSampler 节点就是在这个空间中执行采样过程。图像被映射到潜在空间后,扩散过程在这个空间中进行。在 ComfyUI 中,你可以通过节点调整对潜在空间的操作,如噪声添加、去噪步数等。这部分通常由潜在空间操作模块来实现。 扩散过程(Diffusion Process):噪声的生成和逐步还原:扩散过程表示的是从噪声生成图像的过程。在 ComfyUI 中,这通常通过调度器(Schedulers)控制,典型的调度器有 Normal、Karras 等,它们会根据不同的采样策略逐步将噪声还原为图像。你可以通过 ComfyUI 中的“采样器”节点选择不同的调度器,来控制如何在潜在空间中处理噪声,以及如何逐步去噪回归到最终图像。时间步数:在生成图像时,扩散模型会进行多个去噪步。图中展示的 zT 代表不同时间步长下的潜在表示。在 ComfyUI 中,你可以通过控制步数来影响图像生成的精细度和质量。 延伸应用:开源项目作者 ailm 在 ComfyUI 上搭建了一个可以接入飞书的 AI 女友麦洛薇(mylover),实现了稳定人设,无限上下文,永久记忆,无缝联动 SD 绘图等功能。由于是基于 comfyui 开发,适合完全没有代码基础的小伙伴们复现并且按自己的想法修改工作。
2025-03-06
comfyUI怎么用
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI。 简介: 可以把它想象成集成了 stable diffusion 功能的 substance designer,通过将 stable diffusion 的流程拆分成节点,实现了更加精准的工作流定制和完善的可复现性。 优劣势: 优势: 1. 对显存要求相对较低,启动速度快,出图速度快。 2. 具有更高的生成自由度。 3. 可以和 webui 共享环境和模型。 4. 可以搭建自己的工作流程,可以导出流程并分享给别人,报错的时候也能清晰的发现错误出在哪一步。 5. 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势: 1. 操作门槛高,需要有清晰的逻辑。 2. 生态没有 webui 多(常用的都有),也有一些针对 Comfyui 开发的有趣插件。 官方链接: 从 github 上下载作者部署好环境和依赖的整合包,按照官方文档按照即可:https://github.com/comfyanonymous/ComfyUI 安装部署: 1. 电脑硬件要求: 系统:Windows7 以上。 显卡要求:NVDIA 独立显卡且显存至少 4G 起步。 硬盘留有足够的空间,最低 100G 起步(包括模型)。 注:mac 系统,AMD 显卡,低显卡的情况也可以安装使用,功能不全,出错率偏高,严重影响使用体验个人建议升级设备或者采用云服务器玩耍。 下载并更新 Nvidia 显卡驱动下载地址 https://www.nvidia.cn/ geforce/drivers/ 2. 下载并安装所需要环境: 依次下载并安装 python、Git、VSCode,安装过程中一直点击勾选对应选项,一直下一步。 安装 Python https://www.python.org/downloads/release/python3119/ ,安装的时候选中“将 Python 添加到系统变量”。 安装 VSCode https://code.visualstudio.com/Download 。 安装 Git https://gitscm.com/download/win 。 安装 CUDA https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 。 生图原理: ComfyUI 是一个开源的图形用户界面,用于生成 AI 图像,主要基于 Stable Diffusion 等扩散模型。 1. Pixel Space 和 Latent Space: Pixel Space(像素空间):图的左边表示输入图像的像素空间,在 ComfyUI 中,这个对应于你可能通过“图像输入”模块或直接从文本提示生成的随机噪声图像。在生成过程结束时,系统会将处理后的潜在表示转换回像素空间,生成最终的图像。 Latent Space(潜在空间):ComfyUI 中的应用:ComfyUI 的许多操作都在潜在空间中进行,如 KSampler 节点就是在这个空间中执行采样过程。图像被映射到潜在空间后,扩散过程在这个空间中进行。在 ComfyUI 中,你可以通过节点调整对潜在空间的操作,如噪声添加、去噪步数等。这部分通常由潜在空间操作模块来实现。 2. 扩散过程(Diffusion Process): 噪声的生成和逐步还原:扩散过程表示的是从噪声生成图像的过程。在 ComfyUI 中,这通常通过调度器(Schedulers)控制,典型的调度器有 Normal、Karras 等,它们会根据不同的采样策略逐步将噪声还原为图像。 时间步数 TTT:在生成图像时,扩散模型会进行多个去噪步。图中展示的 zT 代表不同时间步长下的潜在表示。在 ComfyUI 中,你可以通过控制步数来影响图像生成的精细度和质量。
2025-03-06
有哪些本地生图工具
以下是一些本地生图工具: Liblib 在线生图: 本地 ComfyUI Flux + Lora 工作流: 。 SDXL:可以将图片发送到图生图当中,大模型切换为“refiner”,重绘幅度开小一点,再次点击生成。还可以安装 refine 插件,在扩展列表中搜索 refine 并安装,启用后可在文生图界面直接使用 refine 模型。
2025-03-06
请给出图像智能修改的智能体
以下是一些关于图像智能修改的智能体相关信息: 在一键改图工作流方面:此过程未用大模型,未消耗 token。每次生成结果唯一,无种子概念,无法保存特定结果。调好后可配东北大花袄等背景,修改名字便于排查问题。用户界面可直接拿到返回变量值,返回文本需手动以 Markdown 格式拼接变量。点击立即生成按钮可添加多种事件,表单默认有点击时事件,表单提交时可调用工作流并传入对应参数。表单有 unsubmit、error 和数据改变时等事件,可设置提交时调用工作流,限制上传文件数量,表单提交时可设置禁用态。对左侧图片进行数据绑定,选择工作流和对应颜色,保存刷新查看生成结果。工作流数据绑定要先清空,避免手动输入变量,选工作流时要注意准确。调好第一张图片后复制成三张,根据背景颜色区分,通过连接节点选择对应图片输出。在用户界面不发布也可调试,有预览功能。识别图片特征有误时需在工作流里优化提示词,可考虑使用视频模型。应用界面数据无法直接带到智能体,可尝试左右布局,左边表单右边互动。 在 Coze 工作流创建室内设计师方面:打开 Coze 官网 https://www.coze.cn/home 创建 Bot。图像流分为智能生成、智能编辑、基础编辑三类。Coze 的图像流很像 ComfyUI,但是比 ComfyUI 更普世化,更简单易上手。空间风格化插件有参数,如 image_url 是毛坯房的图片地址;Strength 是提示词强度,影响效果图;Style 是生成效果的风格,如新中式、日式、美式、欧式、法式等。按照构架配置工作流,调试工作流毛坯房测试用例:https://tgi1.jia.com/129/589/29589741.jpg 。开始节点对应配置三项内容,然后点击右上角发布,机器人就可以出图。 在产品买点提炼神器强化版方面:智能体功能实现包括卖点提炼模块,通过提问引导用户发掘产品/服务的卖点,若用户无法准确回答则交由大模型帮助回答并生成可能的卖点。卖点修改模块对大模型总结的卖点进行精细化调整,用户可根据满意度选择跳过、修改补充、让大模型补充或重新生成全部内容。内容展示模块将生成的内容利用图像流制作成可保存的图片,制作美观的图片模板,从工作流中传入产品名称、卖点、买点等信息并在图片中展示,将生成的图片链接通过结束节点输出,并在工作流的消息节点展示。
2025-03-06
有类似cherrystudio这种专门用于生图的Agent?
目前尚未有像 CherryStudio 这样专门用于生图的知名 Agent 。但在 AI 领域,不断有新的工具和技术出现,您可以持续关注相关的科技动态以获取最新信息。
2025-03-06
ChatGPT
2025-03-06