Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

langchain还有哪些应用？可否提供langchain初学者的教程

Answer

LangChain 是一个用于开发由语言模型驱动的应用程序的框架，它提供了广泛的应用可能性。以下是一些LangChain的应用示例，以及为初学者提供的教程资源：

聊天机器人（Chatbots）：构建具备记忆能力的聊天机器人框架，可以进行实时交互并提供用户友好的界面。
文本总结（Summarization）：对长文本或文档进行自动总结，提取关键信息。
文档问答（Question and Answering Over Documents）：使用文档作为上下文信息，基于文档内容进行问答。
信息抽取（Extraction）：从文本内容中抽取结构化信息。
结果评估（Evaluation）：分析并评估语言模型输出结果的质量。
数据库问答（Querying Tabular Data）：从数据库或类数据库内容中抽取数据信息。
代码理解（Code Understanding）：分析代码并从代码中获取逻辑，支持代码相关的问答。
API交互（Interacting with APIs）：使语言模型能够理解和调用API，以获取或发送数据。
智能体（Agents）：使用语言模型进行任务分析和决策，并调用工具执行决策。

对于LangChain初学者，可以访问官网，以下是一些教程资源：

快速入门：提供了安装LangChain及其组件的基本命令和步骤。
LangChain快速上手教程：以浅显易懂的方式介绍了LangChain的安装和基本概念。
LangChain中文入门教程：为中文用户提供的入门教程，包括安装和基本操作。
LangChain框架介绍：介绍了LangChain框架的核心价值主张和设计理念。

这些资源可以帮助初学者理解LangChain的基本概念，安装过程，以及如何开始构建自己的LangChain应用程序。

Content generated by AI large model, please carefully verify (powered by aily)

References

开发：LangChain应用开发指南-大模型的知识外挂RAG

开发：LangChain应用开发指南-大模型的知识外挂RAG

从零开始，用GPT打造个人知识库

LLM开源中文大语言模型及数据集集合

信鑫：基于大模型 + 知识库的 Code Review 实践

开发：LangChain应用开发指南-熟用LCEL语法掌握Chain的精髓

Others are asking

知识库中的LangChain和LangGraph的内容有哪些？

以下是关于 LangChain 和 LangGraph 的相关内容： LangChain： LangChain 是一个由 Harrison Chase 开发的开源 Python 库，旨在支持使用大型语言模型（LLM）和外部资源（如数据源或语言处理系统）开发应用程序。它提供了标准的接口，与其他工具集成，并为常见应用程序提供端到端链。设计主张集中在模块化组件上，这些组件提供用于使用 LLM 的行为抽象，并为每个抽象提供实现的集合，从而允许开发人员构造新链或实现现成的链。 LangChain 和 RAG 的关系： LangChain 是一个用于构建高级语言模型应用程序的框架，提供了实现 RAG 所必需的工具和组件。 RAG 即检索增强生成，是一种结合了检索（检索外部知识库中相关信息）和生成（利用 LLM 生成文本）的技术。 LangChain 作为框架，与 RAG 的关系包括：是框架与技术的关系，允许通过模块化组件构建 RAG 应用程序，简化开发过程，提高性能，支持构建复杂的 RAG 应用。关于大模型 RAG 应用中的 LangChain：有从产品视角出发的分享，包括项目背景、初步体验和评测结果等。预计会分成 3 篇分享，分别是 LangChain 框架初体验、调优思路分享、如何测评。

langchain到底是什么。如何理解。

LangChain 是一个用于构建高级语言模型应用程序的框架，旨在简化开发人员使用语言模型构建端到端应用程序的过程。它具有以下特点和优势： 1. 提供了一系列工具、组件和接口，使利用大型语言模型（LLM）和聊天模型创建应用程序更便捷。 2. 核心概念包括组件和链，组件是模块化构建块，可组合创建强大应用，链是一系列组件或其他链的组合，用于完成特定任务。 3. 具有模型抽象功能，能为用例选择合适模型，并利用组件构建应用。 4. 支持创建和管理提示模板，引导语言模型生成特定输出。 5. 允许开发人员定义处理步骤链，完成复杂任务。 6. 支持构建代理，能使用语言模型做决策并调用工具。 7. 支持多种用例，如针对特定文档的问答、聊天机器人、代理等，可与外部数据源交互收集数据，并提供内存功能维护状态。 LangChain 还是一个为简化大模型应用开发而设计的开源框架，通过提供模块化的工具和库，允许开发者轻松集成和操作多种大模型，将更多精力投入到创造应用的核心价值上。其设计注重简化开发流程，支持广泛的模型，具备良好的可扩展性，以适应业务需求变化。作为得到社区广泛支持的开源项目，拥有活跃的贡献者和持续更新，提供全面的文档和示例代码帮助新用户快速掌握，同时充分考虑了应用的安全性和用户数据的隐私保护，是多语言支持的灵活框架，适用于各种规模的项目和不同背景的开发者。 LangChain 官方手册：https://python.langchain.com/docs/get_started/introduction/

什么是langchain

LangChain 是一个用于构建高级语言模型应用程序的框架，旨在简化开发人员使用语言模型构建端到端应用程序的过程。它具有以下特点和优势： 1. 提供一系列工具、组件和接口，使创建由大型语言模型（LLM）和聊天模型支持的应用程序更易实现。 2. 核心概念包括组件和链，组件是模块化的构建块，链是组合在一起完成特定任务的一系列组件（或其他链）。 3. 具有模型抽象功能，提供对大型语言模型和聊天模型的抽象，便于开发人员选择合适模型并利用组件构建应用。 4. 支持创建和管理提示模板，引导语言模型生成特定输出。 5. 允许开发人员定义一系列处理步骤，按顺序执行完成复杂任务。 6. 支持构建代理，能使用语言模型做决策并根据用户输入调用工具。 7. 支持多种用例，如针对特定文档的问答、聊天机器人、代理等，可与外部数据源交互收集数据，还提供内存功能维护状态。 LangChain 是一个为简化大模型应用开发而设计的开源框架，通过提供模块化的工具和库，允许开发者轻松集成和操作多种大模型，将更多精力投入到创造应用的核心价值上。其设计注重简化开发流程，支持广泛的模型，具备良好的可扩展性，适应不断变化的业务需求。作为得到社区广泛支持的开源项目，拥有活跃的贡献者和持续更新，提供全面的文档和示例代码帮助新用户快速掌握，在设计时充分考虑应用的安全性和用户数据的隐私保护，是多语言支持的灵活框架，适用于各种规模的项目和不同背景的开发者。 LangChain 官方手册：https://python.langchain.com/docs/get_started/introduction/

如何通过langchain实现上传一个客户需求文档，生成一个产品规格书doc格式的文档

要通过 LangChain 实现上传客户需求文档并生成产品规格书（doc 格式），可以按照以下步骤进行： 1. 上传文档：用户可以上传包含知识的文档，支持 txt、pdf、docx 等格式，LangChain ChatChat 会将文档转换为 Markdown 格式。 2. 文本切割：为便于分析和处理，将长文本切割为小块（chunk）。 3. 文本向量化：将切割的 chunk 通过 embedding 技术，转换为算法可以处理的向量，存入向量数据库。 4. 问句向量化：用户提问后，同样将用户的问句向量化。 5. 语义检索匹配：将用户的问句与向量数据库中的 chunk 匹配，匹配出与问句向量最相似的 top k 个。 6. 提交 prompt 至 LLM：将匹配出的文本和问句，一起添加到配置好的 prompt 模板中，提交给 LLM。 7. 生成回答：LLM 生成回答，返回给用户。

LangChain 是一个用于构建高级语言模型应用程序的框架，具有以下特点和功能：旨在简化开发人员使用语言模型构建端到端应用程序的过程，提供了一系列工具、组件和接口，使创建由大型语言模型（LLM）和聊天模型支持的应用程序更易实现。核心概念包括组件和链，组件是模块化的构建块，链是组合在一起完成特定任务的一系列组件（或其他链）。具有模型抽象、提示模板和值、链、代理等功能。支持多种用例，如针对特定文档的问答、聊天机器人、代理等，且可与外部数据源交互并提供内存功能。 LangChain 与 RAG（检索增强生成）的关系：框架与技术：LangChain 作为框架，提供实现 RAG 必需的工具和组件，RAG 技术可在其框架内实施利用。模块化实现：允许开发者通过模块化组件构建 RAG 应用程序。简化开发：通过提供现成的链和提示模板简化 RAG 应用开发过程。提高性能：利用 LangChain 实现 RAG 可创建更高效、准确的应用程序，尤其在需大量外部信息辅助决策的场景。应用构建：通过丰富的 API 和组件库支持构建复杂的 RAG 应用，如智能问答系统、内容推荐引擎等。在开发 LangChain 应用时，构建 RAG 应用的相关组件包括数据加载器、文本分割器、文本嵌入器、向量存储器、检索器、聊天模型等，一般流程如下：（具体流程未给出，如有需要请补充提问）

详细介绍下langchain

LangChain 是一个用于构建高级语言模型应用程序的框架，旨在简化开发人员使用语言模型构建端到端应用程序的过程。它具有以下特点和优势： 1. 提供一系列工具、组件和接口，使基于大型语言模型（LLM）和聊天模型创建应用程序更轻松。 2. 核心概念包括组件和链，组件是模块化构建块，可组合创建强大应用，链是一系列组件或其他链的组合，用于完成特定任务。 3. 具有模型抽象功能，提供对大型语言模型和聊天模型的抽象，便于开发人员选择合适模型并利用组件构建应用。 4. 支持创建和管理提示模板，引导语言模型生成特定输出。 5. 允许开发人员定义处理步骤链，按顺序执行完成复杂任务。 6. 支持构建代理，能使用语言模型做决策并根据用户输入调用工具。 7. 支持多种用例，如特定文档问答、聊天机器人、代理等，可与外部数据源交互收集数据，还提供内存功能维护状态。 LangChain 是一个开源框架，为简化大模型应用开发而设计。它通过提供模块化的工具和库，允许开发者轻松集成和操作多种大模型，将更多精力投入到创造应用的核心价值上。其设计注重简化开发流程，支持广泛的模型，具备良好的可扩展性以适应业务需求变化。作为社区广泛支持的开源项目，拥有活跃的贡献者和持续更新，提供全面的文档和示例代码帮助新用户快速掌握。同时，在设计时充分考虑应用的安全性和用户数据的隐私保护，是多语言支持的灵活框架，适用于各种规模的项目和不同背景的开发者。 LangChain 官方手册：https://python.langchain.com/docs/get_started/introduction/

我是一个AI Agent初学者，现在我想要捏一款Agent，目的是喂给Agent固定材料之后对其做提问，让Agent学习完我的材料之后，在不联网的情况下对我问出的问题做出贴切材料的回答，现在请你告诉我如何操作

以下是捏制一个满足您需求的 AI Agent 的操作步骤： 1. 规划：制定任务的关键方法，总结任务目标与执行形式。将任务分解为可管理的子任务，确立逻辑顺序和依赖关系。设计每个子任务的执行方法。 2. 实施：在 Coze 上搭建工作流框架，设定每个节点的逻辑关系。详细配置子任务节点，并验证每个子任务的可用性。 3. 完善：整体试运行 Agent，识别功能和性能的卡点。通过反复测试和迭代，优化至达到预期水平。 AI Agent 相关概念： AI Agent 是基于大型语言模型（LLM）和其他技术实现的智能实体，其核心功能在于自主理解、规划决策、执行复杂任务。 Chain：通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤，可以接受一些输入变量，产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 Router：可以使用一些判定（甚至可以用 LLM 来判定），然后让 Agent 走向不同的 Chain。例如：如果这是一个图片，则 a；否则 b。 Tool：Agent 上可以进行的一次工具调用。例如，对互联网的一次搜索，对数据库的一次检索。常见的 AI Agent 类型包括： Responser Agent：主 agent，用于回复用户（伪多模态）。 Background Agent：背景 agent，用于推进角色当前状态（例如进入下一个剧本，抽检生成增长的记忆体）。 Daily Agent：每日 agent，用于生成剧本，配套的图片，以及每日朋友圈。 Background Agent 每隔一段时间运行一次（默认 3 分钟），分析期间的历史对话，变更人物关系（亲密度，了解度等），变更反感度，如果超标则拉黑用户，抽简对话内容，提取人物和用户的信息成为“增长的记忆体”，按照时间推进人物剧本，有概率主动聊天（与亲密度正相关，跳过夜间时间）。

我是一个AI Agent初学者，现在我想要捏一款Agent，目的是喂给Agent固定材料之后对其做提问，让Agent学习完我的材料之后，在不联网的情况下对我问出的问题做出贴切材料的回答

以下是为您提供的关于捏制 AI Agent 的相关知识：一、手捏 AI Agent 的思路在 Coze 中创建工作流驱动的 AI Agent，简单情况可分为 3 个步骤： 1. 规划制定任务的关键方法。总结任务目标与执行形式。将任务分解为可管理的子任务，确立逻辑顺序和依赖关系。设计每个子任务的执行方法。 2. 实施在 Coze 上搭建工作流框架，设定每个节点的逻辑关系。详细配置子任务节点，并验证每个子任务的可用性。 3. 完善整体试运行 Agent，识别功能和性能的卡点。通过反复测试和迭代，优化至达到预期水平。二、AI Agent 的概念 AI Agent 是基于大型语言模型（LLM）和其他技术实现的智能实体，其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念： 1. Chain：通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤，可以接受一些输入变量，产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router：可以使用一些判定（甚至可以用 LLM 来判定），然后让 Agent 走向不同的 Chain。例如：如果这是一个图片，则 a；否则 b。 3. Tool：Agent 上可以进行的一次工具调用。例如，对互联网的一次搜索，对数据库的一次检索。同时，需要三个 Agent： Responser Agent：主 agent，用于回复用户（伪多模态）。 Background Agent：背景 agent，用于推进角色当前状态（例如进入下一个剧本，抽检生成增长的记忆体）。 Daily Agent：每日 agent，用于生成剧本，配套的图片，以及每日朋友圈。三、Agent 的“明斯基时刻” 心灵社会理论认为，智能是由许多简单的 Agent（分等级、分功能的计算单元）共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能，通过协作实现复杂的智能行为。其特点包括： 1. 多重层次：心灵社会将智能划分为多个层次，从低层次的感知和反应到高层次的规划和决策，每个层次由多个 Agent 负责。 2. 功能模块：每个 Agent 类似于功能模块，专门处理特定类型的信息或执行特定任务，如视觉处理、语言理解、运动控制等。 3. 分布式智能：智能不是集中在单一的核心处理单元，而是通过多个相互关联的 Agent 共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性，应对复杂和多变的环境。同时，在《心灵社会》中，明斯基还详细描述了不同类型的 Agent 及其功能：专家 Agent：拥有特定领域知识和技能的 Agent，负责处理复杂的任务和解决特定问题。管理 Agent：协调和控制其他 Agent 的活动，确保整体系统协调一致地运行。学习 Agent：通过经验和交互，不断调整和优化自身行为，提高系统在不断变化环境中的适应能力。

请推荐1~2款适合初学者的AI编程助手和编程学习工具

以下是 1 2 款适合初学者的 AI 编程助手和编程学习工具： v0：适合初学者，能为编程提供一定的辅助和支持。 Bolt：对新手友好，有助于初学者在编程过程中获得帮助和指导。此外，还有一些其他常见的适合初学者的工具，如 GitHub Copilot，它支持多种语言和 IDE，能为程序员快速提供代码建议；通义灵码，提供行级/函数级实时续写、自然语言生成代码等多种能力。您可以根据自己的需求选择最适合您的工具。

初学者教程

以下为您提供一些适合初学者的 AI 教程资源： Blender 相关：新手免费入门教程：https://flowus.cn/share/bf6780f53c0a43999e6cdf4a9f48d52b Blender 插件的安装方法和汉化、包括疑难杂症解决：https://flowus.cn/share/79f8f60ac2e94d669a56572d2cda5641 Up B 站空间：https://space.bilibili.com/206992617?spm_id_from=333.1007.0.0 关于 Blender 找工作问题：https://flowus.cn/share/7000d5e84ca94f0cb493406b08c29e3f Blender 插件寻找与下载：https://flowus.cn/share/42a2af8dbaf04d1db309fe33dcb061d2 Blender 资产、贴图、等等免费网站：https://flowus.cn/share/606da95d9130451f96000fe3789e3a42 提升审美网站：https://flowus.cn/share/0f6bad6a46034b8082a27a8c69bb1caa 面向 AI 应用的同学：微软的 AI 初学者课程：https://microsoft.github.io/AIForBeginners/ AI for every one（吴恩达教程）：https://www.bilibili.com/video/BV1yL411u7q6 大语言模型原理介绍视频（李宏毅）：https://www.bilibili.com/video/BV1TD4y137mP/ 谷歌生成式 AI 课程：目录：https://ywh1bkansf.feishu.cn/wiki/DTm0way7QiKyHckMXsjc00kIn6e ChatGPT 入门：目录：https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc 微信机器人共学教程第一天教程 COW 部署的配置环境：刚才在这里保存的“外网面板地址”，点击打开。（有小伙伴反馈，命令输出的地址是 login 结尾的，点击打不开。那您只需要把 login 改成 http://xxx.xxx.xx.xxx:8888/tencentcloud 就可以了）输入账号密码，即上图中的 username、password 第一次进入会让您绑定一下，点击免费注册，注册完成后，返回此页，登录账号。首次会有个推荐安装，只安装第一个即可。其他的取消勾选。

Coze 智能体教程初学者 3个月内的内容

以下是为初学者提供的 Coze 智能体相关教程，预计在 3 个月内可以完成学习： 1. 页面布局：常见的左右、上下布局及嵌套方法，包括如何设置容器实现左右布局、调整大小分割等，强调外层高度设置的重要性。溢出处理方式及内边距影响，建议初学者用固定宽高布局。换行布局及元素分布设置，用于图片排版。证件照应用搭建过程及布局设置，如创建应用、清理页面，设置第一个 div 容器，证件照基础界面为上下布局，分标题、示例、操作展示三块，需拖三个容器，顶部高度大概 100。 2. 证件照应用的用户界面搭建与业务逻辑构建：用户界面搭建，包括各部分尺寸、布局、组件设置，如文本、图片、表单等。业务逻辑搭建，创建工作流，添加图片理解、图像生成、智能换脸等插件，设置参数、提示词，并告知文档地址在社区智能体 1.3 共学里。 3. 工作流与代码（重度用户）：对于轻度用户，不需要工作流；对于重度用户，可参考官方文档：https://www.coze.cn/docs/guides/welcome 。工作流的优势，如解决速度慢和可能出错的问题。介绍主工作流和 AI Project 工作流，以及中间用到的 python 代码和结合工作流修改的「人设与回复逻辑」。 4. 基础通识课：在 cos 主页有新手教程文档，可据此构建智能体。工作流偏向节点调用，可通过 prompt 构建提示词并优化。能调用多种插件，可添加图像流、触发器和知识库，知识库可上传多种格式内容及在线链接以沉淀知识。 Nimbus 介绍智能交互相关内容，包括有趣的智能体、插件商城、扣子案例、模型社区并答疑。 AI 编程课前准备及相关工具、账号注册说明，如注册阿里云账号、安装无影、注册 GitHub 账号等。

初学者可以从哪些方面上手

对于初学者上手 AI，以下是一些建议： 1. 调度器和采样器方面：可以从 Euler 或 DDIM 开始，因为它们提供了良好的平衡点，便于快速了解生成过程。如果对生成过程中的稳定性和细节处理有严格要求，可以考虑 DPM++ SDE Karras、LCM 和 Dynamic Thresholding 这样的采样器。在需要快速生成图像的情况下，DPM fast、Euler 和 DDIM Fast 是不错的选择。如果希望生成更具创意或独特风格的图像，可以尝试 Heun、DPM++ 3M SDE Palefire 以及 Restart 采样器。对于高要求的图像生成任务，推荐使用 DPM++ 3M SDE Karras、DPM2 Exponential 和 LCM 这些经过优化的采样器。 2. 基本概念方面：阅读「」部分，熟悉 AI 的术语和基础概念，了解人工智能及其主要分支（如机器学习、深度学习、自然语言处理等）以及它们之间的联系，浏览入门文章。在「」中找到为初学者设计的课程，特别推荐李宏毅老师的课程。通过在线教育平台（如 Coursera、edX、Udacity）上的课程按照自己的节奏学习。选择感兴趣的模块深入学习，掌握提示词的技巧。 3. 实践方面：理论学习之后进行实践，尝试使用各种产品做出作品。在知识库分享实践后的作品和文章。 4. 体验方面：与现有的 AI 产品进行互动，如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人，了解它们的工作原理和交互方式。 5. Prompt 方面：认真写出自己的第一个 prompt，理解 GPT 的工作原理，至少先真正理解以下几个问题：GPT 说人话的能力是怎么来的、“涌现”的产生、prompt 的概念和意义、为什么现阶段我们不得不用 prompt。推荐两个课外阅读，即 B 站 UP Yjango（于建国博士）很早前发布的相关视频。您还可以关注获取更多内容。

deepseek官方教程

以下是关于 DeepSeek 的官方教程相关信息：火山方舟 DeepSeek 申请免费额度教程，包含多种 API 使用方式，如飞书多维表格调用、Coze 智能体调用、浏览器插件调用。可以使用邀请码 D3H5G9QA，通过邀请链接 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 邀请可拿 3000 万 tokens，畅享 671B DeepSeek R1，活动截止至北京时间 20250218 23:59:59。同时，火山方舟大模型服务平台的模型服务计费文档有更新，DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。有关于一线教师的 AI 需求与高效工具推荐，如让模型创作诗歌、生成宣传标语、提示库（https://apidocs.deepseek.com/zhcn/promptlibrary）、代码解释、内容分类、角色扮演（自定义人设）、散文写作、文案大纲生成、模型提示词生成等。 2 月 14 日的社区动态中，有《突破 DeepSeek R1 能力天花板，火山引擎扣子+飞书一站式企业解决方案》《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》等内容，还附上了飞书多维表格、Coze 的接入使用方法等。此外，还有关于 DeepSeek 关键 9 篇论文及创新点的讲解，以及 DeepSeek 官方发布的 R1 模型推荐设置。

以下是关于 MCP 教程的相关内容：资源链接：什么是 MCP 以及为什么要用它： Model Context Protocol（模型上下文协议），简称 MCP，是由 Anthropic 公司提出的一个开放标准，旨在解决 AI 模型与外部数据源和工具之间的连接问题。 MCP 就像是 AI 世界的“USBC 接口”，它提供了一种标准化的方式，让 AI 应用能够轻松连接到各种数据源和工具，不需要为每个新连接重新开发接口。 MCP 解决的主要问题包括：碎片化集成：以前每个 AI 应用都需要单独开发与各种数据源的连接。重复工作：不同团队重复构建相似的集成方案。 “N 乘 M 问题”：当有 N 个 AI 客户端需要连接 M 个数据源时，可能需要 N×M 个自定义集成。希望这篇教程能帮助您了解 MCP 的基础知识，并开始构建自己的 MCP 服务器！随着实践的深入，您会发现 MCP 为 AI 应用与数据源及工具的集成提供了简单而强大的解决方案。本篇内容由 Genspark 制作 https://www.genspark.ai/autopilotagent_viewer?id=c10e49b3228d4f65be347ab34777aaf8

以下是为您提供的 Coze 教程相关信息：一泽 Eze 的教程：可能是全网最好的 Coze 教程之一，一次性带您入门 Coze 工作流。即使是非技术出身的爱好者也能上手跟学，一站式学会 AI Agent 从设计到落地的全流程方法论。阅读指南：长文预警，请视情况收藏保存。核心看点包括通过实际案例逐步演示用 Coze 工作流构建能稳定按模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法。适合人群为玩过 AI 对话产品的一般用户，以及对 AI 应用开发平台（如 Coze、Dify）和 AI Agent 工作流配置感兴趣的爱好者。注：本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中，附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容，以供前置或拓展学习。其他相关基础教程：大圣：胎教级教程：万字长文带你使用 Coze 打造企业级知识库（https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb）大聪明：保姆级教程：Coze 打工你躺平（https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb）安仔：Coze 全方位入门剖析免费打造自己的 AI Agent （https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb）基础教程：Coze“图像流”抢先体验（https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf） YoYo：Coze 图像流小技巧：探索视觉艺术的隐藏宝藏（https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe）【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档（https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ）

如何使用MCP？提供教程

以下是关于如何使用 MCP 的详细教程：前置准备工作：任选一个客户端软件进行配置，大致分为四步： 1. 填入大模型 API 密钥。 2. 找到 MCP 配置界面。 3. 填入 MCP Server 对应的 json 脚本。 4. 使用 MCP。不同客户端软件的配置方法： 1. Cherry Studio（推荐）：版本：2025 年 4 月发布的 1.1.17。配置大模型 API：填入之前准备好的 AiHubMix 的 API 密钥。配置 MCP：例如，图中填写的就是 Playwright 的 MCP Server 和百度地图的 MCP Server。使用 MCP。 2. Cursor（推荐）：配置大模型 API：如果 Cursor Pro 在免费试用期，这一步可以不做；如果不在免费试用期，最好的办法是氪金，也可以试试填入之前准备好的 AiHubMix 的 API 密钥。配置 MCP Server：填入 MCP Server 的 json，保存。回到 Cursor 的 MCP 配置页面，等待几秒钟，多点几次蓝色框里的按钮，直到绿灯亮起，并显示出所有 MCP 工具。使用 MCP：Ctrl+Shift+L 新建对话，将模式设置为 Agent。 3. Claude Desktop：配置 MCP Server：用文本编辑器（VSCode、Sublime Text 等）打开 claude_desktop_config.json 文件，填入 MCP Server 对应的 json 文件，保存。重启 Claude Desktop。查看 MCP Server 连接状态。使用 MCP。 MCP 的好处： 1. 简化开发：一次整合，多次复用，不再重复开发。 2. 灵活性强：轻松切换 AI 模型或工具，无需复杂的重新配置。 3. 实时互动：长连接保证数据实时更新。 4. 安全可靠：内置标准化安全和权限控制。 5. 扩展性强：AI 系统扩展时，只需连接新的 MCP 服务器。传统 API 更适合的场景： 1. 需要细粒度控制、功能严格限制。 2. 更偏好紧耦合以提升性能。 3. 希望最大化交互的可预测性。快速集成 MCP 的步骤： 1. 定义能力：明确您的 MCP 服务器提供哪些功能。 2. 实现 MCP 层：按照协议标准进行开发。 3. 选择通信方式：本地连接（标准输入输出）或远程连接（如 WebSockets）。 4. 创建资源/工具：开发或连接您的数据源和服务。 5. 建立客户端连接：与 MCP 服务器建立安全稳定的连接。 MCP 与 API 的比较： MCP 与传统 API 之间的主要区别在于： 1. 单一协议：MCP 充当标准化的“连接器”，因此集成一个 MCP 意味着可能访问多个工具和服务，而不仅仅是一个。 2. 动态发现：MCP 允许 AI 模型动态发现可用工具并与之交互，而无需对每个集成进行硬编码知识。 3. 双向通信：MCP 支持持久的实时双向通信类似于 WebSockets。AI 模型既可以检索信息，也可以动态触发操作。以 Cursor 驱动 blender 自动化建模的 MCP 项目为例：首先，在 github 上找到项目说明（https://github.com/ahujasid/blendermcp）。以 Mac 安装为例，首先要安装一个 uv 包（如果不懂，就直接新建一个项目文件夹后，将相关需求丢给 AI）。显示 uv 安装完毕后（初次使用可能需要安装一系列的环境，只要一路让 AI 安装就可以了），还是找到点击界面右上角的小齿轮图标。找到 MCP 模块 Add new global MCP server，将相关内容粘贴进去。退回 MCP 界面时，就会发现已经连接上了这个 blender 服务器，并且增加了很多具体功能。

以下是为您提供的 AI 视频教程相关内容： AI 让古画动起来的教程： 1. 对于简单的图，找原图直接写提示词即可。若碰到多人多活动的复杂图，需把长图分多个模块，比如将一张图分成 4 个模块。 2. 智能抠图，用工具把要动的内容去除掉，用 AI 生成图片部分。若有水印，可以把图片向下拓展一部分，然后截掉。 3. 将要拿来动起来的部分抠出，放在绿幕背景里或者画的背景颜色，导出图片。 4. 用 AI 视频生成工具写入提示词让图片动起来，如即梦、海螺、混元等工具，不停尝试抽卡。 5. 用剪映把抽卡合格的视频放在去掉内容的背景图片，通过色度抠图调整去掉视频的背景。多个视频放在背景图片，一起动即可。 AI 视频相关的软件教程：包括视频模型如 luma Dream Machine、可灵、MiniMax 海螺 AI、Sora、Vidu 等，工具教程如 Hedra，视频工具如 VIGGLE，以及应用教程如视频转绘、视频拆解等。相关链接如下： WaytoAGI X 剪映的 AI 创意视频征集令·第 1 期： 1. 征集内容：使用 AI 功能创作的创意视频成片，也可投稿 AI 创意视频的教程（教大家如何做一个 AI 创意视频）。AI 功能包括但不限于：AI 对口型、AI 改动作、AI 配音、克隆音色、AI 音乐、AI 特效、AI 图文成片、AI 剪视频等。不包括纯图片生成或纯视频生成的内容（特指用 AI 工具生成的图片、图生视频，但视频里没有添加 AI 功能）。 2. 创作工具：主要使用「剪映」平台工具创作，可多使用剪映平台的 AI 功能/新功能；部分 AI 效果若剪映无法实现，可使用其他软件创作。 3. 内容价值：视频需有消费价值，要有一定内容主题，有故事感、或者有梗、或者有核心观点表达，让用户有持续观看和点赞、收藏的欲望。缺少内容主题、过于简单、过于模板化的内容将不予通过。在抖音、小红书等平台点赞量高的内容，审核通过率大大提升！ 4. 原创度：作品需要原创、极具创意和独特性，且符合当代年轻群体的审美和兴趣喜好，不可照搬、抄袭他人创意，一经发现将取消活动奖励，视情节严重情况回收灵感发布权限。 5. 作品延展度：作品有可模仿性，其他创作者看完后，可模仿学习或二创。比如：前期素材易获取，后期素材易剪辑或处理，让其他视频创作者有强烈的模仿欲望，且对自己模仿或二创视频有成就感和分享欲。 6. 作品时长：时长适中，最短不低于 15 秒，最长不建议超过 3 分钟。

AI出设计图教程

以下是关于 AI 出设计图的教程：使用 Midjourney 生成 UI 界面：页面指令：指定生成某个页面（如首页、登录页等），只需添加页面指令描述，如“landing page”（登录页）、“Profile Page”（个人资料页）。社交平台：关键词“landing page”可生成社交平台的登录页设计。信息类：关键词“Profile Page”可生成人力资源类产品的个人资料页，包含照片、自我介绍、基本信息等内容。 Midjourney 产出的设计图视觉效果不错，适合在 APP 设计的初始阶段，如头脑风暴和风格探索中为设计师提供灵感和创意。但目前要直接用于开发仍有距离。使用 Claude 生成设计稿的技巧：引用 Tailwind CSS 写组件样式，确保色彩、响应式和基础组件的美观度。按照特定的四个技巧可让 Claude 设计出美观的界面或组件。生成设计稿的方法：将生成的代码部署到线上，使用 html.to.design 这个 Figma 插件将网页转换为设计稿，但每天免费次数有限。进阶技巧和关键词：图片内容一般分为二维插画和三维立体两种表现形式。主题描述：可描述场景、故事、元素、物体或人物细节等。描述场景中的人物时应独立描述，避免长串文字，否则 AI 可能识别不到。设计风格：可通过找风格类关键词参考或垫图/喂图，让 AI 根据给出的图片风格结合主题描述生成相应风格的图片。对于材质的描述，关键词的运用较为复杂，需要针对特定风格进行“咒语测试”。

可否输入一次同时使用多个人工智能

360 于 8 月 1 日发布了集合国内 16 家主流模型的 AI 助手。用户可以通过其桌面客户端和浏览器等多个入口随时唤起，支持在同一问题上同时使用多个模型进行解答。当用户不确定选择哪个模型时，AI 助手会通过意图识别自动选择模型。您可以体验一下：https://bot.360.com

可否将 coze 平台上的 bot 部署到微信小程序上？应该怎么做？

将 Coze 平台上的 Bot 部署到微信小程序上可以参考以下步骤： 1. 通过 Coze 建立定时任务，执行工作流二，并添加如分析文章和搜索文章等能力，使其成为一个消息情报官的 Agent。 2. 发布到想要的平台，如微信小程序等。 3. 登录宝塔面板，在宝塔面板中可视化控制云服务器，部署 Docker 容器，启动 COW 项目与微信取得关联。在宝塔面板中操作，包括添加 Docker 中的“项目模板”等。将编译好的内容复制进来，创建容器，选择容器编排，填入模板和名称。查看运行情况，手动刷新日志，若看到“WeChat login success”，则成功将 Bot 接入微信。 4. 记下要对接的 Coze AI Bot 的 Bot ID，在其设计界面所在的链接中获取，然后将 Bot 发布到 Bot as API 上。