Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

文心，豆包，通义，智谱等都在推出自己的智能体，这对用户个人来说如何选择应用方向呢？

Answer

选择适合自己的智能体主要取决于您的具体需求和期望。以下是一些可能的考虑因素：

功能性：不同的智能体可能在特定的功能或任务上表现更好。例如，一些智能体可能在文本创作、数学解析或代码编写等方面表现出色。
使用体验：用户体验可能会因智能体的交互设计、响应速度、易用性等因素而有所不同¹。
安全性和隐私：考虑智能体如何处理和保护您的数据和隐私。
社区和支持：一些智能体可能有活跃的开发者社区和丰富的学习资源，这可能对某些用户来说很有吸引力。
特定领域的应用：如果您在特定领域（如教育、金融、医疗等）有特定需求，那么某些智能体可能会更适合。

总的来说，选择哪个智能体最终取决于您的个人需求和偏好。建议您尝试几个不同的智能体，看看哪个最符合您的需求。希望这些信息对您有所帮助！

Content generated by AI large model, please carefully verify (powered by aily)

References

熊猫Jay：GPTs 从入门、进阶、实践到防护的万字教程

AGI万字长文（上）| 2023回顾与反思

像高手一样编写 GPT：从基础到实践，学习使用 GPT 的 Action

AIGC Weekly #46

观点：当大家反对用 AI 育儿时，它却“救”了我两次！

Others are asking

目前市面上的文心一言，通义，deepseek等，用于写作效果如何

目前市面上的文心一言、通义、DeepSeek 等用于写作的效果各有特点：文心一言（百度）：大语言模型，可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。通义（阿里巴巴）：在特定领域和任务上表现出卓越的能力。 DeepSeek：在文字能力上表现突出，尤其在中文场景中高度符合日常、写作习惯，但在专业论文总结方面稍弱。数学能力经过优化表现不错，编程能力略逊于 GPT。需要注意的是，不同模型的效果会因用户的具体需求和使用场景而有所差异。

文心一言的收费模式

文心一言将从 4 月 1 日起全面免费。申请开通文心一言的 API 需前往百度。

对DeepSeek-R1、GPT-4o、文心一言、通义千文、豆包、海信星海和混元模型的性能对比分析

以下是对 DeepSeekR1、GPT4o、文心一言、通义千文、豆包、海信星海和混元模型的性能对比分析：通义千问：通义团队将 Qwen2.5Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama3.1405B 以及同样位列开源稠密模型前列的 Qwen2.572B 进行了对比。在所有 11 项基准测试中，Qwen2.5Max 全部超越了对比模型。 Qwen2.5Max 已在阿里云百炼平台上架，企业和开发者可通过阿里云百炼调用新模型 API，也可在全新的 Qwen Chat 平台上使用。 DeepSeekR1：属于基于强化学习 RL 的推理模型，在回答用户问题前会先进行“自问自答”式的推理思考，以提升最终回答的质量。其“聪明”源于独特的“教育方式”，在其他 AI 模型还在接受“填鸭式教育”时，DeepSeek R1 已率先进入“自学成才”新阶段。其思考与表达碾压了包括 GPT4o、Claude Sonnet3.5、豆包等模型，思考过程细腻、自洽、深刻、全面，输出结果在语气、结构、逻辑上天衣无缝。目前关于文心一言、海信星海和混元模型在上述内容中未提供具体的性能对比信息。

请对比文心一言、豆包、天工、Kimi以上几个软件各自的优势

以下是文心一言、豆包（字节跳动）、天工（不太明确您提到的天工具体所指，可能是指某些特定的模型或产品）、Kimi 这几个软件的优势对比：文心一言 4.0（网页版）：优势：由百度开发，可能在某些特定领域的知识储备和语言理解能力上有一定优势。豆包（字节跳动）：优势：无需科学上网，使用方便。 Kimi：优势：不需要科学上网，无收费，不需要登录可以直接使用；有案例，点击预设问题即可开始尝试。需要注意的是，对于不同的用户和应用场景，这些软件的优势可能会有所不同，其表现也会受到数据、算法、训练等多种因素的影响。

文心一言和通义千问哪个更强

文心一言和通义千问在不同方面各有特点。对于律师答辩状 prompt 的评测：文心一言：输入起诉状后，直接给出起诉状范本，未理解 prompt 输出答辩状。经提示输出的答辩状存在主体少、不专业、错误多等问题，但提示输出应诉方案时，能按 prompt 结构输出，内容简洁明了，可作为框架使用。通义千问：输入起诉状后，欢迎语直接，无废话，能正确处理两个答辩人，但专业度稍差，未引用具体法律条文。提示输出应诉方案时，能按 prompt 结构输出，整体内容及格，无亮点。在结构化 prompt 的测试和反馈中：文心一言的综合评分为 2.25 分，整体表现一般。通义千问的综合评分为 3.125 分，表现还算不错，若内容再提高些，体验感和专业性会更好。此外，文心一言和通义千问都是国内免费的 APP。文心一言是百度出品的 AI 对话产品，定位为智能伙伴；通义千问是由阿里云开发的聊天机器人。

文心一言比赛

以下是关于文心一言的相关测评信息： 1. 小七姐的测评：任务一：短提示。设置让模型生成能根据用户需求写出合适的 RPG 游戏策划（包括角色、剧情、玩法和场景等内容）的提示词。文心一言在输出结果上依然有自问自答的问题，得分 75。任务二：少样本示例。同样是生成上述提示词，本轮用少样本提示框定了模型的输出内容，四个大模型的输出都有很大提升，文心一言得分 80。 2. 中文大模型基准测评 2023 年度报告：简介：文心一言是百度全新一代知识增强大语言模型，于 2023 年 3 月 16 日正式发布，10 月 17 日发布 V4.0 版本，已有 7000 万用户。模型特点：在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三，各项能力表现均衡且水平较高，是国内有竞争力的大模型。适合应用：能力栈广泛，可应用场景多。重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用，在逻辑推理方面表现不俗，可关注在科学研究、教育、工业方面的落地能力。

智谱清言是智谱 AI 和清华大学推出的大模型产品，其基础模型为 ChatGLM 大模型。2023 年 10 月 27 日，智谱 AI 于 2023 中国计算机大会（CNCC）上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。模型特点：工具使用排名国内第一。在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力，但代码能力还有优化空间。知识百科与其他第一梯队模型相比稍显不足。综合来看，是很有竞争力的大模型。适合应用：场景广泛，根据 SuperCLUE 测评结果，优先推进在 AI 智能体方面相关的应用，包括任务规划、工具使用及长文本记忆相关场景。在较复杂推理应用上效果不错。广告文案、文学写作方面也是很好的选择。

智谱 AI 相关信息如下： 2024 年 10 月 AI 行业大事记中，智谱开源了文生图模型 CogView3Plus3B。智谱 AI 开源的语言模型列表（Chat 模型）： ChatGLM26B32k：第二代 ChatGLM 长上下文对话模型，在 ChatGLM26B 的基础上进一步强化了对长文本的理解能力，能处理最多 32K 长度的上下文。 ChatGLM26B32kint4：ChatGLM26B32K 的 int4 版本。 ChatGLM6B：第一代 ChatGLM 对话模型，支持中英双语，基于 General Language Model架构，具有 62 亿参数。 ChatGLM26B：第二代 ChatGLM 对话模型，相比一代模型性能更强，基座模型的上下文长度从 2k 扩展到 32k，在对话阶段使用 8K 的上下文长度训练，推理速度相比初代提升 42%。 ChatGLM26Bint4：ChatGLM26B 的 int4 量化版本，具备最小 5.1GB 显存即可运行，INT4 量化下，6G 显存支持的对话长度由 1K 提升到了 8K。

智谱清言是智谱 AI 和清华大学推出的大模型产品，其基础模型为 ChatGLM 大模型。2023 年 10 月 27 日，智谱 AI 于 2023 中国计算机大会（CNCC）上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。模型特点：工具使用排名国内第一。在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力，但代码能力有优化空间，知识百科与其他第一梯队模型相比稍显不足。综合来看，是很有竞争力的大模型。适合应用：场景广泛，可优先推进在 AI 智能体方面相关的应用，包括任务规划、工具使用及一些长文本记忆相关的场景。在较复杂推理应用上效果不错。广告文案、文学写作方面也是很好的选择。在对结构化 prompt 的测试和反馈中，输入智谱清言后，问题和文心一言一样，需先改写再看输出效果。改写后效果不错，能理解 prompt，输出内容感觉良好。这里最大的体会是结构化 prompt 非常重要，要从结构化开始，且要不断迭代，根据输出结果不断优化。

智谱AI插件在哪儿调用

智谱 AI 插件的调用方式如下：针对智谱，重复类似操作，调用的是 https://chatglm.cn/chatglm/backendapi/v1/conversation/recommendation/list 接口。这里只用到了 conversation_id 一个字段，用的是 GET 请求。通过此接口返回问题，参数用的是整轮对话窗口的唯一 Id：66c01d81667a2ddb444ff878 。打开飞书多维表格，新增列时，您可以选择字段捷径，在字段捷径的 AI 中心，找到智谱 AI 的字段插件。智谱 AI 近期发布了 3 个飞书多维表格的字段插件：AI 内容生成、AI 视频生成和 AI 数据分析。在微信超级 AI 知识助手教学（上）—智谱共学营智能纪要中，有智谱大语言模型的使用与功能介绍，包括角色扮演模型设置、变量插入方法、插件调用情况等。还提到了智浦轻颜的功能与应用，如文章总结功能、视频生成功能、画图功能等，以及多维表格相关内容。

智谱AI插件在哪儿

智谱 AI 插件可在飞书多维表格中找到。具体操作如下： 1. 打开飞书多维表格，新增列时，选择字段捷径。 2. 在字段捷径的 AI 中心，就能找到智谱 AI 的字段插件，包括 AI 内容生成、AI 视频生成和 AI 数据分析插件。智谱 AI 的 3 个字段插件均免费，您可以尝试将其运用在工作中。同时，若想基于 GLM4Flash 开发更多免费插件，可参考。

COZE 和智谱AI的优缺点对比

COZE 的优点： 1. 逼真且有沉浸感：通过图片和文字描述模拟急诊室的真实场景，用户可体验到紧张真实的医疗环境。可进一步增加场景细节，如急诊室的声音效果，增强沉浸感。 2. 互动性强：设置多个决策点，用户需做出选择，提高用户参与感和学习效果。可引入更多分支场景，根据用户不同选择生成不同结局，提高互动的深度和多样性。 3. 情感共鸣：通过详细的病人背景故事，用户能更好理解患者处境，增强同理心。可增加更多病人案例，覆盖不同病情和背景，使情感共鸣更丰富多样。 4. 延续字节风格，能自己做闭环，可在工作流基础上用用户界面包装成产品发布。 COZE 的缺点：商业化探索尚未铺开，用户来源不明确。目前没有明确信息表明其是否开源，社区参与和开源协作程度可能不如 Dify。智谱 AI 的优点：目前信息中未明确提及智谱 AI 的具体优点。智谱 AI 的缺点：目前信息中未明确提及智谱 AI 的具体缺点。两者的对比： 1. 开源性：Dify 是开源的，允许开发者自由访问和修改代码；Coze 目前没有明确信息表明其是否开源。 2. 功能和定制能力：Dify 提供直观界面，结合多种功能，支持通过可视化编排基于任何 LLM 部署 API 和服务；Coze 提供丰富插件能力和高效搭建效率，支持发布到多个平台作为 Bot 能力使用。 3. 社区和支持：Dify 作为开源项目有活跃社区，开发者可参与共创共建；Coze 可能更多依赖官方更新和支持，社区参与和开源协作程度可能不如 Dify。

豆包如何创建智能体？

创建智能体的方法如下： 1. 通过 Coze 平台创建：找到灵感：如果没有 Bot 灵感，可以查看获取灵感。进行 Bot 创建：打开扣子助手。修改 Prompt，发送 Prompt1。让扣子助手帮忙创建 Bot。点击打开创建好的 Bot。发布作品：点击【发布】。填写发布记录，发布到 Bot 商店。复制智能体链接。 2. 在一枚扣子平台创建：第一步，创建一个智能体，使用单 Agent 对话流模式。编排对话流：点击创建一个新的对话流（记得要和智能体关联），编排相关流程。测试：找到一篇小红书笔记，试运行对话流，直接在对话窗口输入地址，查看数据是否成功。回到智能体的编排页面，同样进行测试，确保对话流执行成功。发布：点发布后，只选择多维表格，然后进行配置。包括输出类型、输入类型等，完善上架信息，提交上架信息后，返回配置界面会显示已完成，即可完成最终的提交。另外，在教学场景中使用豆包创建智能体时，例如让学生模拟杜甫进行回答，可设置相关 prompt，选择特定声音等，并通过学生小组讨论设计问题来进行教学。

豆包如何创建智能体？

创建智能体的方法如下：通过 Coze 平台创建：找到灵感，可以查看获取。进行 Bot 创建，通过扣子助手快速进行，包括修改 Prompt、让扣子助手帮忙创建 Bot 以及点击打开创建好的 Bot 等步骤。发布作品，包括点击【发布】、填写发布记录并发布到 Bot 商店、复制智能体链接。在一枚扣子平台创建：第一步，创建一个智能体，使用单 Agent 对话流模式。编排对话流，点击创建新的对话流并与智能体关联。进行测试，找到一篇小红书笔记，试运行对话流。发布，点发布后选择多维表格，进行配置，包括输出类型、输入类型等，完善上架信息并提交。此外，还有在教学场景中使用豆包创建智能体的示例，如设定为杜甫的角色，并设定相关 prompt 和声音等。

以DeepSeek R1为代表的推理模型，与此前模型（如 ChatGPT-4、Claude 3.5 sonnet、豆包、通义等）的差异点主要在于

以 DeepSeek R1 为代表的推理模型与此前模型（如 ChatGPT4、Claude 3.5 sonnet、豆包、通义等）的差异点主要在于： 1. 技术路线：DeepSeek R1 与 OpenAI 现在最先进的模型 o1、o3 一样，属于基于强化学习 RL 的推理模型。 2. 思考方式：在回答用户问题前，R1 会先进行“自问自答”式的推理思考，模拟人类的深度思考，从用户初始问题出发，唤醒所需的推理逻辑与知识，进行多步推导，提升最终回答的质量。 3. 训练方式：在其他模型还在接受“填鸭式教育”时，DeepSeek R1 已率先进入“自学成才”的新阶段。 4. 模型制作：R1 是原生通过强化学习训练出的模型，而蒸馏模型是基于数据微调出来的，基础模型能力强，蒸馏微调模型能力也会强。此外，DeepSeek R1 还能反过来蒸馏数据微调其他模型，形成互相帮助的局面。 5. 与 Claude 3.7 Sonnet 相比，Claude 3.7 Sonnet 在任务指令跟随、通用推理、多模态能力和自主编程方面表现出色，扩展思考模式在数学和科学领域带来显著提升，在某些方面与 DeepSeek R1 各有优劣。

豆包AI有网址吗

豆包 AI 是抖音旗下基于云雀大模型开发的 AI 工具，提供聊天机器人、写作助手以及英语学习助手等功能。其访问网址是：https://www.doubao.com/ 。此外，为您提供部分其他 AI 网站的信息：文心一言：yiyan.baidu.com Beacons AI：beacons.ai Hugging Face：huggingface.co ZeroGPT：zerogpt.com Gamma：gamma.app Gauth：gauthmath.com Feedly：feedly.com Loom：loom.com mailchimp：mailchimp.com prezi：prezi.com Poe AI 平台是一个支持与多个智能 AI 机器人进行实时在线交流的聊天网站，包括 GPT4 等。注册账号后可免费使用，部分功能需要付费订阅。其官网地址是：https://poe.com/ ，可在官网帮助中心上找到具体教程。

豆包如何克隆声音

以下是关于克隆声音的相关信息： ElevenLabs 推出了全自动化的 AI 配音或视频翻译工具。您只需上传视频或粘贴视频链接，它能在几十秒到几分钟内将视频翻译成 29 种语言，还能克隆原视频中的声音进行配音。群友瑞华进行了测试，相关视频链接为：。另外，有群友测试了豆包的音色模仿，读大概 20 个字的句子，5 秒就能生成非常像的音色，之后可用自己的声音读生成的文字内容。在 Heygen 等网站可以自助购买声音克隆服务。 MiniMax 有两个适合任务的大模型（豆包的也不错）：MiniMaxText01 支持 400 万 token 的上下文，T2A v2（speech01turbo）拥有最好的声音复刻效果。可通过其开放平台 https://platform.minimaxi.com/login 进行注册登录及实名认证。首次注册会赠送 15 元，无需充值就能玩。接着创建 API Key 并保存好，还可以克隆声音，链接为：https://platform.minimaxi.com/examinationcenter/voiceexperiencecenter/voiceCloning 。克隆时有几个地方要填：创建 voice id、上传复刻音频（10 300 秒，尽量安静）、上传音频 prompt（不超过 8 秒的声音）、试听文本（不超过 8 秒声音所念内容），然后勾选用户协议，点击“克隆”选项，过一段时间完成克隆。使用填写的 voice id 生成声音，即为克隆音色生成的声音。

使用豆包即梦和通义app绘制海报封面都是出现文字不对的情况，有哪些改进的或者是更好的解决方案

以下是针对使用豆包即梦和通义 app 绘制海报封面出现文字不对情况的改进和解决方案：使用豆包即梦： 1. 为其他城市定制艺术字海报：可以使用豆包来生成个性化设计。豆包会根据城市特色和地标调整提示词，创造符合城市风格的艺术作品。打开豆包网站 https://www.doubao.com/chat 。输入对应内容获得城市的 AI 绘画提示词。 2. 优化海报细节：利用即梦中的消除笔工具修正细节错误。例如，若生成图片中有元素不协调或小细节（如文字笔画、图案）错误，可用消除笔去除不需要的部分。多抽卡获取更理想设计。AI 绘画核心在于多抽卡，若首次生成效果不佳，可多次尝试或调整提示词细节抽卡，直至找到满意设计。希望这些方案能帮助您解决问题，创作出满意的海报封面。

通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash，这3个视觉理解大模型哪个最厉害？

以下是对通义千问 Qwen2.5VL 模型的介绍：版本：有 3B、7B 和 72B 三个尺寸版本。主要优势：视觉理解能力：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。视频理解能力：支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作。万物识别：擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。精准的视觉定位：采用矩形框和点的多样化方式对通用物体定位，支持层级化定位和规范的 JSON 格式输出。全面的文字识别和理解：提升 OCR 识别能力，增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析：设计了更全面的文档解析格式，称为 QwenVL HTML 格式，能够精准还原文档中的版面布局。增强的视频理解：引入动态帧率（FPS）训练和绝对时间编码技术，支持小时级别的超长视频理解，具备秒级的事件定位能力。开源平台： Huggingface：https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope：https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat：https://chat.qwenlm.ai 然而，对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型，目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容，因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看，其在视觉理解方面具有较强的能力和优势。

通义提示词教程

以下是关于通义提示词的相关教程： 1. 小七姐的 Prompt 喂饭级系列教程小白学习指南（一）：提示词的理解：如果您是低年级学生看不懂英文问题，可让 GPT 为您翻译和解释，并让其举例帮助理解。应用方法：对于没看懂的句子，都可以通过提示词让 GPT 换种说法解释和举例。自测方法：点击链接查看对话原文，顶部的问题可复制作为 prompt 自行提问。下一节将带来 prompt 小白系列课程（二）如何开始练习有效提问。 2. 不懂代码，也能 3 小时打造并上架一款 AI 插件：初版提示词：如果不了解如何从 0 1 编写词生卡 Prompt，请阅读前作，这套提示词在后续测试中，在多种模型中都能保持较高成功率和稳定的预期效果。 3. SD 新手入门图文教程：提示词语法：根据想画的内容写提示词，多个提示词之间用英文半角符号。一般概念性、大范围、风格化的关键词写在前，叙述画面内容的其次，描述细节的最后。每个词语在模型中的自带权重可能不同，特异性、具体且措辞不抽象的关键词效果更好。可使用括号人工修改提示词的权重。

阶跃星辰、通义千问、Gemini三个视频理解模型哪个收费更便宜

以下是阶跃星辰、通义千问、Gemini 三个视频理解模型的收费情况：阶跃星辰：输入价格为 0.005～0.015 元/千 tokens，输出价格为 0.02～0.07 元/千 tokens。通义千问：Qwenvlplus 模型调用价格为 0.008 元/千 tokens，训练价格为 0.03 元/千 tokens。 Gemini 未提及收费信息。综上，从已有的信息来看，通义千问的收费相对可能更便宜，但具体还需根据您的使用情况和需求来判断。

通义千问的视频理解模型怎么使用

通义千问的 Qwen2.5VL 视频理解模型具有以下特点和使用方式：版本：推出 3B、7B 和 72B 三个尺寸版本。主要优势：视觉理解能力：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。视频理解能力：支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作，如给指定朋友送祝福、电脑修图、手机订票等。万物识别：擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。精准的视觉定位：采用矩形框和点的多样化方式对通用物体定位，支持层级化定位和规范的 JSON 格式输出。全面的文字识别和理解：提升 OCR 识别能力，增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析：设计了更全面的文档解析格式，称为 QwenVL HTML 格式，能够精准还原文档中的版面布局。增强的视频理解：引入动态帧率（FPS）训练和绝对时间编码技术，支持小时级别的超长视频理解，具备秒级的事件定位能力。开源平台： Huggingface：https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope：https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat：https://chat.qwenlm.ai

通义的日活是多少？

根据提供的信息，阿里通义在 11 月的活跃用户为 147 万人，WEB 月活为 141 万人，APP 月活为 355 万人，全网月活为 496 万人。在 9 月的活跃用户为 529 万人。

通义千问发展历程

通义千问是阿里云推出的大语言模型。于 2023 年 4 月 11 日在阿里云峰会上正式发布 1.0 版本。9 月 13 日，通义千问大模型首批通过备案。10 月 31 日，阿里云正式发布千亿级参数大模型通义千问 2.0，8 大行业模型同步上线。9 月，通义千问 2.5 系列全家桶开源。