Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

我想在dify里按照一个reranker模型，推荐哪个

Answer

在 Dify 中安装 reranker 模型，推荐使用中转服务商。Dify 的部署版本中，模型需自行配置，官方和中转的都支持，但中转服务商从性价比角度更优，充点小钱就能用上各种模型，价格通常有较大折扣，20 刀普通用户能用很久，还能在不同地方使用。若没有合适的中转服务商，可使用我自用的，点击原文即可。模型设置方面，在 Dify 右上角点击设置-模型供应商，填入中转服务商提供的信息（一般包括 API base 或 Base URL 以及 key）并保存。若保存成功，回到主页面创建一个 Agent 测试，正常则大功告成。比如我填的 API base 是‘https://one.glbai.com’。

Content generated by AI large model, please carefully verify (powered by aily)

References

【0门槛】一键部署自己的Dify网站

Dify的部署版本，除了服务器是自己提供的以外，模型也需要我们自己来配置。官方和中转的都支持，不过从性价比来说的话，还是推荐中转的吧，充点小钱，啥模型都能用上，贼划算，而且一般比起官方的价格都很很大的折扣，20刀普通用户可以用很久了，还能在不同的地方使用。如果你们没有合适的中转服务商的话，可以直接用我自用的，我用了近2年了，而且拿到了比较低的价格，点击原文就可以。【模型设置】在Dify右上角，点击设置-模型供应商。找到你自己的中转服务商提供的信息，填上保存就可以了。服务商一般会给两个信息，API base（或者叫Base URL，每个中转服务商的都不一样，Dify这里直接填URL就可以，比如我填的就是‘https://one.glbai.com’），和key。如上图所示，如果能保存成功，则说明信息配置是正确的。这个时候，我们回到主页面，随便创建一个Agent测试一下，一切正常，大功告成。

Others are asking

Dify 是一个开源的大模型应用开发平台。它融合了后端即服务和 LLMOps 的理念，为用户提供直观界面，能快速构建和部署生产级别的生成式 AI 应用。该平台具有以下特点： 1. 强大的工作流构建工具。 2. 支持广泛的模型集成。 3. 提供功能丰富的提示词 IDE。 4. 拥有全面的 RAG Pipeline 用于文档处理和检索。 5. 允许用户定义 Agent 智能体。 6. 通过 LLMOps 功能持续监控和优化应用程序性能。 Dify 提供云服务和本地部署选项，满足不同用户需求。其开源特性确保对数据的完全控制和快速产品迭代。设计理念注重简单性、克制和快速迭代，能帮助用户将 AI 应用创意快速转化为现实。无论是创业团队构建 MVP、企业集成 LLM 增强现有应用能力，还是技术爱好者探索 LLM 潜力，Dify 都提供相应支持和工具。 Dify 官方手册：https://docs.dify.ai/v/zhhans 。一般来说，如果是个人研究，推荐单独使用 Dify；如果是企业级落地项目，推荐使用多种框架结合，效果更好。

哪里可以搜到dify的相关学习资料

以下是一些可以搜到 Dify 相关学习资料的途径： 1. 您可以通过以下链接获取相关学习资料：https://docs.dify.ai/v/zhhans/gettingstarted/installselfhosted/dockercompose 。这些命令通常在宝塔面板的终端安装，若想了解命令的含义，可直接询问 AI 。 2. 微信文章：，该文章介绍了如何在几分钟内使用 Dify 平台快速定制网站的 AI 智能客服，即使是非技术人员也能操作。请注意，以上内容由 AI 大模型生成，请仔细甄别。

dify工作流中agent节点怎么使用

在 Dify 工作流中使用 Agent 节点的步骤如下： 1. 搭建工作流框架：进入 Coze，点击「个人空间工作流创建工作流」，打开创建工作流的弹窗。根据弹窗要求自定义工作流信息，点击确认完成新建。左侧「选择节点」模块中，根据子任务需要，实际用上的有插件（提供能力工具拓展 Agent 能力边界）、大模型（调用 LLM 实现文本内容生成）、代码（支持编写简单脚本处理数据）。按照流程图在编辑面板中拖入对应的 LLM 大模型、插件、代码节点完成框架搭建。 2. 测试 Agent 节点功能：完成任何一个节点的配置后，都需要进行试运行测试以验证节点的运行效果。步骤一：点击「测试该节点」。步骤二：按格式要求输入待测试的输入内容，如果是 array 等其他格式，请自行对话 AI 或搜索网络确认格式要求。步骤三：点击「展开运行结果」，检查输入、输出项是否有误。如果有误，请依次检查“测试输入内容”、“节点配置”是否有误，以及优化“提示词”以提升对生成内容的约束力。当多次测试时输入与输出都符合预期，就可以进入下一个子任务的配置。

Dify 是一个开源的大模型应用开发平台：构建知识库的具体步骤：准备数据：收集文本数据，包括文档、表格等格式，进行清洗、分段等预处理以确保数据质量。创建数据集：在 Dify 中创建新数据集，上传准备好的文档，并编写良好描述。配置索引方式：提供三种索引方式（高质量模式、经济模式和 Q&A 分段模式），根据实际需求选择，如追求高准确度可选高质量模式。集成至应用：将数据集集成到 Dify 的对话型应用中，在应用设置中配置数据集使用方式。持续优化：收集用户反馈，对知识库内容和索引方式持续优化和迭代，定期更新增加新内容。平台特点：结合后端即服务和 LLMOps 理念，提供直观界面快速构建和部署生产级别的生成式 AI 应用。具备强大工作流构建工具，支持广泛模型集成，提供功能丰富的提示词 IDE 和全面的 RAG Pipeline 用于文档处理和检索。允许用户定义 Agent 智能体，通过 LLMOps 功能对应用程序性能持续监控和优化。提供云服务和本地部署选项，满足不同用户需求，开源特性确保对数据完全控制和快速产品迭代。设计理念注重简单性、克制和快速迭代，为创业团队构建 MVP、企业集成 LLM 等提供支持和工具。官方手册：https://docs.dify.ai/v/zhhans 。一般来说，个人研究推荐单独使用 Dify，企业级落地项目推荐多种框架结合。

以下是关于 Dify 的教程： Differential Diffusion 教程：技术适用场景：特别适用于需要保持图像整体一致性和自然感的场景。软填充技术：用于平滑填补图像空白或损坏部分，同时细微调整周围区域，确保新填充内容与原始图像无缝融合。强度扇：一种可视化不同编辑强度效果的工具，帮助用户通过可视化方式理解不同编辑强度的效果。无需训练或微调：操作仅在推理阶段进行，不需要对模型进行额外训练或微调。与现有扩散模型兼容：可集成到任何现有的扩散模型中，增强编辑和生成能力，适用于 Stable Diffusion XL、Kandinsky 和 DeepFloyd IF 等不同的扩散模型。主要功能特点：精细的编辑控制：通过引入变化地图，可对图像每个像素或区域指定不同变化程度，支持离散和连续编辑。文本驱动的图像修改：通过文本提示指导图像修改方向。软填充技术：在填补图像空白或修复部分时，能细微调整周围区域确保无缝融合。 Dify 接入企业微信教程：创建聊天助手应用：在 Dify 平台创建基础编排聊天助手应用，获取 API 密钥和 API 服务器地址。下载 Dify on WeChat 项目：下载并安装依赖。填写配置文件：在项目根目录创建 config.json 文件，填写 API 密钥和服务器地址。把基础编排聊天助手接入微信：快速启动测试，扫码登录，进行对话测试，可以选择源码部署或 Docker 部署。把工作流编排聊天助手接入微信：创建知识库，导入知识库文件，创建工作流编排聊天助手应用，设置知识检索节点和 LLM 节点，发布更新并访问 API。把 Agent 应用接入微信：创建 Agent 应用，设置对话模型和添加工具，生成 API 密钥，填写配置文件，启动程序并进行测试。更多内容请访问原文：https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat

Dify 是一个开源的大模型应用开发平台：理念：结合后端即服务和 LLMOps 的理念。特点：提供直观界面，能快速构建和部署生产级别的生成式 AI 应用。具有强大的工作流构建工具，支持广泛的模型集成，有功能丰富的提示词 IDE 和全面的 RAG Pipeline 用于文档处理和检索。允许用户定义 Agent 智能体，通过 LLMOps 功能对应用程序性能持续监控和优化。部署选项：提供云服务和本地部署，满足不同用户需求。开源特性：确保对数据的完全控制和快速产品迭代。设计理念：注重简单性、克制和快速迭代，旨在帮助用户将 AI 应用的创意快速转化为现实。推荐使用方式：个人研究推荐单独使用，企业级落地项目推荐多种框架结合。 Dify 官方手册：https://docs.dify.ai/v/zhhans

Reranker 是在 AI 搜索和相关流程中用于对检索结果进行重排的重要环节。在 AI 搜索中，如果要做多信息源整合，就需要对多信息源的检索结果进行重排。重排的目的主要有两个：一是过滤掉跟搜索 query 不相关的参考信息，二是对参考信息的相关性进行排序，以便在做上下文挂载时，优先截取权重最高的 top_k 条记录作为引用参考。做重排的方案有多种，例如 ThinkAny 尝试过使用 zilliz 向量数据库 + llamaindex 框架做相似度匹配，以及使用 FlashRank 开源框架，但前者效率较低，后者准确度不够高。在基于 Notion 和 Coze 打造个人知识问答系统以及 RAG 流程中，也存在检索结果可能包含无关信息和排序并非最优的问题。为解决此问题，在 RAG 流程中加入一个 Reranker 模块对检索的信息结果进行打分和重排可以显著提高回答质量，RAG 也因此变成了 RetrieveRerankGenerate（Re2G）。在某些场景中，会直接使用 LLM 来做打分和重排。在 RAG 中，其主要组成依次是数据提取——embedding（向量化）——创建索引——检索——自动排序（Rerank）——LLM 归纳生成。核心在于能否将内容检索得又快又准。

大模型的系统提示词

大模型的系统提示词主要包括以下方面： 1. 在“五津：一键生成‘摸鱼打工猫’视频”中，针对用户选择的主题和回答，总结用户的创作意图，如“打工猫摸鱼的 2 小时，在巴厘岛能看一场日落”，并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词，以数组形式输出到“tishici”，将用户意图输出到“biaoti”。 2. 在“云中江树：智能对决：提示词攻防中的 AI 安全博弈”中，系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意；模型侧对于有能力的厂商应增强安全性并平衡性能，开发者则要在开发中带着安全意识优化系统提示词，加入安全引导和禁止内容等；输出侧可使用传统防御和内容过滤手段，并针对大模型特点进行私有数据泄露等检查。此外，还提到间接注入和提示词泄露的情况，间接注入常发生在应用获取依赖外部数据资源时，攻击者通过隐藏恶意指令完成攻击；提示词泄露指试图操纵模型输出获取部分或全部系统提示词，大模型输出内容可分为系统提示词、用户提示和助手提示词三段，通过攻击手段可获取系统提示词。

通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash，这3个视觉理解大模型哪个最厉害？

以下是对通义千问 Qwen2.5VL 模型的介绍：版本：有 3B、7B 和 72B 三个尺寸版本。主要优势：视觉理解能力：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。视频理解能力：支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作。万物识别：擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。精准的视觉定位：采用矩形框和点的多样化方式对通用物体定位，支持层级化定位和规范的 JSON 格式输出。全面的文字识别和理解：提升 OCR 识别能力，增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析：设计了更全面的文档解析格式，称为 QwenVL HTML 格式，能够精准还原文档中的版面布局。增强的视频理解：引入动态帧率（FPS）训练和绝对时间编码技术，支持小时级别的超长视频理解，具备秒级的事件定位能力。开源平台： Huggingface：https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope：https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat：https://chat.qwenlm.ai 然而，对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型，目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容，因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看，其在视觉理解方面具有较强的能力和优势。

目前全世界最厉害的对视频视觉理解能力大模型是哪个

目前在视频视觉理解能力方面表现出色的大模型有： 1. 昆仑万维的 SkyReelsV1：它不仅支持文生视频、图生视频，还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作。擅长万物识别，能分析图像中的文本、图表、图标、图形和布局等。

目前全世界最厉害的视频视觉理解大模型是哪个

目前全世界较为厉害的视频视觉理解大模型有以下几个： 1. 昆仑万维的 SkyReelsV1：不仅支持文生视频、图生视频，是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元：语义理解能力出色，能精准还原复杂的场景和动作，如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5：全球最快的 AI 视频生成模型，Turbo 模式下可在 10 秒内生成视频，最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能，具备顶尖动漫生成能力。

目前全世界最厉害的视觉理解大模型是哪个

目前在视觉理解大模型方面，较为突出的有 DeepSeek 的 JanusPro 模型，它将图像理解和生成统一在一个模型中；还有通义千问的视觉理解模型，其价格有较大降幅。此外，Pixverse V3.5 是全球最快的 AI 视频生成模型，在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型，因为这取决于不同的评估标准和应用场景。

大模型对话产品的优劣

大模型对话产品具有以下优点： 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验，具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接，产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务，适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景，如私有领域知识问答、个性化聊天机器人、智能助手等。大模型对话产品也存在一些缺点： 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情，全靠用户脑补，导致用户上头期短，疲劳度高，长期留存低。 3. 无法回答私有领域问题（如公司制度、人员信息等）。 4. 无法及时获取最新信息（如实时天气、比赛结果等）。 5. 无法准确回答专业问题（如复杂数学计算、图像生成等）。

trae 推荐安装那个版本的 vscode插件

在 Trae 中安装 VS Code 插件可以通过以下方式： 1. 从 Trae 的插件市场安装：在左侧导航栏中，点击插件市场图标，界面左侧显示插件市场面板。搜索您想要的插件并在未安装列表中将其选中，界面上显示该插件的详情窗口，展示该插件的详细说明、变更日志等信息。点击安装，Trae 开始安装该插件。安装完成后，该插件会出现在已安装列表中。 2. 从 VS Code 的插件市场安装：前往。搜索您想要的插件，例如：Pylance。在搜索结果中，点击您所需的插件，您会前往该插件的详情页。在详情页中，点击 Version History。结合插件页的 URL 和 Version History 中的信息，提取出以下信息（以 Pylance 为例）： itemName：URL Query 中的 itemName 字段，如截图中的 mspython.vscodepylance，并将小数点（.）前后的内容分成以下两个字段： fieldA：mspython fieldB：vscodepylance version：如截图中的 2025.1.102 使用提取出来的 3 个字段的值替换下方 URL 中的同名字段。在浏览器中输入修改后的 URL，然后按下回车键，浏览器开始下载该插件。下载完成后，返回 Trae 并打开插件市场。将下载的.vsix 文件拖拽至插件市场面板中，Trae 开始自动安装该插件。安装完成后，该插件会出现在已安装列表中。此外，如果 VS Code 插件市场中某个版本的插件依赖了新版 VS Code 中的某些接口，则可能会导致该插件与 Trae 不兼容。您可以查看该插件的 Version History，然后下载该插件的历史版本。管理插件还包括禁用插件和卸载插件： 1. 禁用插件：在 Trae 中，打开插件市场。在已安装列表中，找到需禁用的插件。鼠标悬浮至列表中的插件，然后点击设置>禁用。或点击该插件以打开其详情窗口，然后点击禁用。 2. 卸载插件：在 Trae 中，打开插件市场。在已安装列表中，找到需卸载的插件。鼠标悬浮至该插件，然后点击卸载。或点击该插件以打开其详情窗口，然后点击卸载。

我想找一个好用的ai绘画，有什么推荐吗

以下是为您推荐的一些好用的 AI 绘画平台： 1. Midjourney：综合体验较好，尤其是其 v6 版本。 2. 可灵 AI：成熟的综合类工具。 3. 即梦 AI：成熟的综合类工具。 4. Krea：集成平台。 5. MewXAI：操作简单，功能丰富，包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址：https://www.mewxai.cn/

推荐一些 AI 工具

以下是为您推荐的一些 AI 工具：辅助编程的 AI 工具： 1. GitHub Copilot：由 GitHub 联合 OpenAI 和微软 Azure 团队推出，支持多种语言和 IDE，能为程序员快速提供代码建议。 2. 通义灵码：阿里巴巴团队推出，提供多种编程相关能力。 3. CodeWhisperer：亚马逊 AWS 团队推出，由机器学习技术驱动，为开发人员实时提供代码建议。 4. CodeGeeX：智谱 AI 推出的开源免费 AI 编程助手，基于 130 亿参数的预训练大模型。 5. Cody：Sourcegraph 推出的 AI 代码编写助手，借助强大的代码语义索引和分析能力了解开发者的整个代码库。 6. CodeFuse：蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手。 7. Codeium：由 AI 驱动的编程助手工具，提高编程效率和准确性。更多辅助编程 AI 产品，还可以查看这里：https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同，您可根据需求选择。内容仿写的 AI 工具： 1. 秘塔写作猫：https://xiezuocat.com/ ，是 AI 写作伴侣，能推敲用语、斟酌文法、改写文风，还能实时同步翻译，支持全文改写等功能，并智能分析文章属性。 2. 笔灵 AI 写作：https://ibiling.cn/ ，是得力的智能写作助手，支持多种写作类型的一键改写/续写/扩写等。 3. 腾讯 Effidit 写作：https://effidit.qq.com/ ，由腾讯 AI Lab 开发的创作助手，提升写作者的写作效率和创作体验。更多 AI 写作类工具可以查看这里：https://www.waytoagi.com/sites/category/2 。内容由 AI 大模型生成，请仔细甄别。与思维导图相关的 AI 工具： 1. GitMind：免费跨平台，可通过 AI 自动生成思维导图，支持多种模式。 2. ProcessOn：国内思维导图+AIGC 的工具，能利用 AI 生成思维导图。 3. AmyMind：轻量级在线，无需注册登录，支持自动生成节点。 4. Xmind Copilot：Xmind 推出的基于 GPT 的 AI 思维导图助手，可一键拓展思路，生成文章大纲。 5. TreeMind：“AI 人工智能”思维导图工具，可输入需求由 AI 自动完成思维导图生成。 6. EdrawMind：提供一系列 AI 工具，包括 AI 驱动的头脑风暴功能。这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图，提高制作效率，为知识工作者带来便利。内容由 AI 大模型生成，请仔细甄别。

想要学习AIGC，推荐下相关的行业大V

以下是一些 AIGC 相关的行业大 V 推荐：：归臧整理的 AIGC 周刊，关注 AI 的朋友每周必读。：连续创业者，Prompt 版块共建者。。：“互联网的那点事”，微博互联网观察家。 ZHO：建筑师｜ComfyUI 设计师。：AIGC 社区野神殿创始人。。赛博禅心：最新最快的 AI 资讯，作者大聪明。张蔚：华兴资本经理，架构和投资版块共建者。：热爱分享，永远好奇，AI 高质量社群组织者。汗青：产品经理｜AI 设计师。此外，还有北京分队中的一些相关人士： Lucky：在信息技术领域公司任职 7 年+，目前担任江西 5 家公司企业级 information security 管理，3 个地区千万级企业级 confidentiality Project 管理，5 个地区上海、合肥、苏州、南京、深圳 information security 体系建设管理顾问，目前一只 20 人+AI 项目团队，终身学习践行者。能提供 AI 相关技术的所有项目，包括 AI 图片视频、2D 动画视频、AI prompt、AI 提示词企业培训、AI 大模型、AI agent、数字人等产品。坐标南昌。粉仔：目前抖音上的 AIGC 相关博主，粉丝画像特别受到中老年妇女们的喜爱，俨然成了她们的偶像。熟悉目前主流的 AIGC 工具。坐标北京。 sam：做技术行业，热爱互联网和 AI 技术。海地老师：AI 影视共创社北京分社的负责人。逍遥游的制片人和编剧。 Sunkim：自由体验设计师，前保利威设计负责人，先后在新浪、百度、脉脉做体验设计工作。对 AIGC 感兴趣，目前在做 AI 口语教育类产品（上线了），和 web3 相关设计，以及跟大伙学习 AI 视频制作。胡凯翔：国企工作 10 余年，后沉迷 AI 提示词研究编写，小七姐第一期课程毕业生，微软、讯飞认证提示词工程师，曾担任破局俱乐部企业培训和 AI+教育行动营教练，共创有约 10 万字 AI+教育手册，使用 AI 辅助阅读和开智，标书、论文的写作，玄学取名和头像设计，目前沉迷个人知识体系的搭建和离谱村系列视频的共创。陈皓/Robin：目前在家科技公司从事产品工作，主要和 Ai，3D 视觉内容+数字人相关；有过知识付费和海外教育的创业经历。

图生图网站排名推荐

以下是为您推荐的图生图网站排名： 1. 文生图： Imagen 3：真实感满分，指令遵从强。 Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。 Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。快手可图：影视场景能用，风格化较差。 Flux.1.1：真实感强，需要搭配 Lora 使用。文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。 Luma：影视感强，但风格单一，糊。美图奇想 5.0：AI 油腻感重。腾讯混元：AI 油腻感重，影视感弱，空间结构不准。 SD 3.5 Large：崩。 2. 图生视频： pd 2.0 pro：即梦生成的画面有点颗粒感，p2.0 模型还是很能打的，很适合做一些二次元动漫特效，理解能力更强，更适合连续运镜。 luma 1.6：画面质量挺好，但是太贵了。可灵 1.6 高品质：YYDS！海螺01live：文生视频比图生视频更有创意，图生也还可以，但是有时候大幅度动作下手部会出现模糊的情况，整体素质不错，就是太贵了。 runway：我的快乐老家，画面质量不算差，适合做一些超现实主义的特效、经特殊就容镜头的。智谱 2.0：做的一些画面特效挺出圈的，适合整过，但是整体镜头素质还差点，好处就是便宜，量大，管饱，还能给视频加音效。 vidu1.5：二维平面动画的快乐老家，适合做特效类镜头，单镜头也很惊艳，大范围运镜首尾帧 yyds!就是太贵了！！！！！ seaweed 2.0 pro：s2.0 适合动态相对小的，更适合环绕旋转运镜动作小的。 pixverse v3 高品质：pincerse 的首尾帧还是非常能打的，就是画面美学风格还有待提升的空间。 sora：不好用，文生视频挺强的，但是最需要的图生视频抽象镜头太多，半成品都算不上，避雷避雷避雷，浪费时间。 3. 小白也能使用的国内外 AI 生图网站：可灵可图 1.5：https://app.klingai.com/cn/texttoimage/new 通义万相（每日有免费额度）：https://tongyi.aliyun.com/wanxiang/creation 文心一言：https://yiyan.baidu.com/ 星流（每日有免费额度）：https://www.xingliu.art/ Libiblib（每日有免费额度但等待较久）：https://www.liblib.art/

现在比较好用的AI硬件工具推荐一下，比如鼠标，眼镜，耳机啥的

以下是为您推荐的一些 AI 硬件工具： 1. 对于将 Raspberry Pi 连接到其他设备的配件，您可以参考：防止过热的散热器 MicroUSB 转 USB 适配器，用于 Logitech 键盘的无线传感器用于显示器的 MiniHDMI 转 HDMI 适配器键盘和鼠标：推荐 2. 在可穿戴方面，以 GenAI 硬件为例，Meta 雷朋眼镜是具有代表性的产品。您还可以查看 GenAI 硬件榜单获取更多信息，比如：，该榜单包含多个分类，数据来源包括 google、tiktok、twitter、亚马逊等。