Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

我想建个AI诗画长廊，请给建议

Answer

Content generated by AI large model, please carefully verify (powered by aily)

Others are asking

我想搭建个人rag知识库，实现本地化部署，可以调用本地大模型去分析知识库的内容进行解答

以下是搭建个人 rag 知识库并实现本地化部署，调用本地大模型分析知识库内容进行解答的详细步骤：一、通过 Open WebUI 使用大模型 1. 访问相关网址，使用邮箱注册账号。 2. 登陆成功后，Open WebUI 一般有两种使用方式，包括聊天对话和 RAG 能力（让模型根据文档内容回答问题，这是构建知识库的基础之一）。 3. 如果要求不高，此时已搭建本地大模型，并通过 Web UI 实现与大模型对话。ChatGPT 访问速度快且回答效果好的原因在于其服务器配置高、训练参数多、数据更优及训练算法更好。二、本地知识库进阶 1. 若要更灵活掌控知识库，需使用额外软件 AnythingLLM，其包含 Open WebUI 的所有能力，并额外支持选择文本嵌入模型和向量数据库。 2. 安装地址：https://useanything.com/download 。安装完成后进入配置页面，主要分为三步：选择大模型、选择文本嵌入模型、选择向量数据库。 3. 在 AnythingLLM 中有 Workspace 的概念，可创建独有 Workspace 与其他项目数据隔离。首先创建工作空间，然后上传文档并在工作空间中进行文本嵌入，选择对话模式（包括 Chat 模式和 Query 模式），最后进行测试对话。三、RAG 是什么利用大模型搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前，需对 RAG 有大概了解。RAG 应用可抽象为 5 个过程： 1. 文档加载：从多种来源加载文档，LangChain 提供 100 多种不同的文档加载器，包括非结构化、结构化数据及代码等。 2. 文本分割：文本分割器把 Documents 切分为指定大小的块，称为“文档块”或“文档片”。 3. 存储：涉及将切分好的文档块嵌入转换成向量形式，并将向量数据存储到向量数据库。 4. 检索：通过检索算法找到与输入问题相似的嵌入片。 5. 输出：把问题及检索出来的嵌入片一起提交给 LLM，LLM 会通过问题和检索出来的提示生成更合理的答案。文本加载器是将用户提供的文本加载到内存中，便于后续处理。

搭建个人知识库

搭建个人知识库主要包括以下几个方面： RAG 技术：利用大模型的能力搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前，需先了解 RAG。大模型训练数据有截止日期，当需要依靠不在训练集中的数据时，主要通过检索增强生成 RAG 实现。RAG 应用包括文档加载（从多种来源加载文档，如 PDF 等）、文本分割（把文档切分为指定大小的块）、存储（将切分好的文档块嵌入并转换为向量形式存储到向量数据库）、检索（通过检索算法找到与输入问题相似的嵌入片）、输出（把问题及检索出的嵌入片提交给 LLM 生成答案）。基于 GPT API 搭建：涉及给 GPT 输入定制化知识，但 GPT3.5 一次交互支持的 Token 有限。为处理大量领域知识，OpenAI 提供了 embedding API 解决方案。embeddings 是浮点数字的向量，向量间距离衡量关联性，小距离表示高关联度。本地知识库进阶：若要更灵活掌控知识库，可使用额外软件 AnythingLLM，其包含 Open WebUI 的能力并额外支持选择文本嵌入模型和向量数据库。安装地址为 https://useanything.com/download ，安装完成后进入配置页面，主要分为三步：选择大模型、选择文本嵌入模型、选择向量数据库。AnythingLLM 中有 Workspace 概念，可创建独有 Workspace 与其他项目数据隔离，包括创建工作空间、上传文档并嵌入、选择对话模式（Chat 模式综合给出答案，Query 模式仅依靠文档数据），配置完成后可进行测试对话。

怎么创建个人知识库

创建个人知识库可以通过以下几种方式： 1. 使用 GPT 打造个人知识库：涉及给 GPT 输入（投喂）定制化的知识，但 GPT3.5 一次交互支持的 Token 有限。 OpenAI 提供了 embedding API 解决方案，可将文本转换成向量（embeddings），节省空间，类似索引。例如，将大文本拆分成小文本块（chunk），通过 embeddings API 转换为向量并保存，用户提问时，将问题也转换为向量，比对后提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。 2. 本地部署大模型搭建个人知识库：利用大模型搭建知识库是 RAG 技术的应用，在实操前需了解 RAG。 RAG 是当需要依靠不在大模型训练集中的数据时，先检索外部数据，然后在生成步骤中将其传递给 LLM。一个 RAG 的应用包括文档加载、文本分割、存储（包括将文档块嵌入转换成向量形式并存储到向量数据库）、检索、输出（把问题及检索出的嵌入片提交给 LLM 生成答案）。文本加载器是将用户提供的文本加载到内存中以便后续处理。

本地部署deep seek后如何搭建个人知识库，详细说明一下每个步骤

以下是本地部署 Deep Seek 后搭建个人知识库的详细步骤： 1. 在 RAGFlow 中配置 Deep Seek 模型返回 RAGFlow ，打开右上角设置，进入模型提供商界面。配置本地部署的 Deep Seek 模型，选择 Ollama ，并根据运行的模型配置相关信息。设置基础 URL 。点击确定。 2. 导入嵌入模型导入一个用于文本向量化的嵌入模型。 3. 设置系统模型设置 4. 创建知识库返回知识库，进入数据集，导入文件或设置文件夹当作知识库。 5. 文件解析对导入的文件进行解析，解析速度取决于本机 GPU 性能（显卡性能），越好的显卡解析越快。 6. 检索测试解析完成后，进行检索测试。 7. 进入聊天界面测试没问题后，可进入聊天界面，助理设置可自行进行。此外，如果想要对知识库进行更灵活的掌控，可以使用 AnythingLLM 软件，步骤如下： 1. 安装 AnythingLLM ，安装地址：https://useanything.com/download 。 2. 安装完成后进入配置页面，主要分为三步：选择大模型。选择文本嵌入模型。选择向量数据库。 3. 构建本地知识库在 AnythingLLM 中创建独有的 Workspace 与其他项目数据隔离。上传文档并在工作空间中进行文本嵌入。选择对话模式，包括 Chat 模式（大模型根据训练数据和上传的文档数据综合给出答案）和 Query 模式（大模型仅依靠文档中的数据给出答案）。 4. 测试对话完成上述配置后，即可与大模型进行对话。在进行本地知识库搭建实操之前，还需要对 RAG 有大概的了解： RAG 是一种检索增强生成技术，应用过程包括文档加载、文本分割、存储（包括将文档块嵌入转换成向量形式并存储到向量数据库）、检索、输出（把问题以及检索出来的嵌入片一起提交给 LLM 生成答案）。文本加载器用于将用户提供的文本加载到内存中以便后续处理。

如何用AI搭建个人知识库

以下是用 AI 搭建个人知识库的方法：首先，要搭建基于 GPT API 的定制化知识库，需要给 GPT 输入（投喂）定制化的知识。但 GPT3.5（即当前免费版的 ChatGPT）一次交互（输入和输出）只支持最高 4096 个 Token，约等于 3000 个单词或 2300 个汉字，容量对于绝大多数领域知识往往不够。为解决此问题，OpenAI 提供了 embedding API 解决方案。 embeddings 是一个浮点数字的向量（列表），两个向量之间的距离衡量它们的关联性，小距离表示高关联度，大距离表示低关联度。比如，向量是数学中表示大小和方向的一个量，通常用一串数字表示，在计算机科学和数据科学中，向量通常用列表（list）来表示。向量之间的距离是一种度量两个向量相似性的方法，最常见的是欧几里得距离。在 OpenAI 词嵌入中，靠近向量的词语在语义上相似。具体操作时，可将大文本拆分成若干个小文本块（也叫 chunk)，通过 embeddings API 将小文本块转换成 embeddings 向量，并在一个地方（向量储存库）中保存这些 embeddings 向量和文本块，作为问答的知识库。当用户提出一个问题时，该问题先通过 embeddings API 转换成问题向量，然后将这问题向量与向量储存库的所有文本块向量比对，查找距离最小的几个向量，把这几个向量对应的文本块提取出来，与原有问题组合成为新的 prompt，发送给 GPT API。例如，有一篇万字长文，拆分成多个 Chrunks 包含不同内容。如果提问是“此文作者是谁？”，可以直观地看出与问题关联度最高的文本块，通过比较 embeddings 向量也能得到结论。最后发送给 GPT API 的问题会类似于“此文作者是谁？从以下信息中获取答案：本文作者：越山。xxxx。《反脆弱》作者塔勒布xxxx。” 此外，还有案例展示了如何在 AI 时代把碎片化信息内化为自己的知识/智慧。比如在读书时看到有触动的文本，将其整理归纳，标记重点，打赏标签，放入笔记系统，准备展开深度思考和实践。基于笔记中提到的 AI 对人的赋能模式，展开深度实践，生成自己的观点和决策，并打造成体系化的内容产品，实现价值。通过一个碎片化知识在左侧知识库中的“点、线、面、体”式的流转，从一个书摘变成一个体系化内容或课程，把“别人说的话”变成“自己的智慧”。

搭建个人知识库

以下是关于如何搭建个人知识库的详细介绍：要搭建基于 GPT API 的定制化知识库，首先需要给 GPT 输入（投喂）定制化的知识。但 GPT3.5（即当前免费版的 ChatGPT）一次交互（输入和输出）只支持最高 4096 个 Token，约等于 3000 个单词或 2300 个汉字，这个容量对于绝大多数领域知识是不够的。为解决此问题，OpenAI 提供了 embedding API 解决方案，可参考 OpenAI embedding documents。 embeddings（直译为嵌入）是一个浮点数字的向量（列表）。两个向量之间的距离衡量它们的关联性，小距离表示高关联度，大距离表示低关联度。向量是数学中表示大小和方向的一个量，通常用一串数字表示，在计算机科学和数据科学中，向量通常用列表（list）来表示，列表是一种包含一组有序元素的数据结构。向量之间的距离是一种度量两个向量相似性的方法，最常见的是欧几里得距离，其计算方法是将两个向量的对应元素相减，然后取平方和，再开平方。在 OpenAI 词嵌入中，靠近向量的词语在语义上相似，例如“猫”和“狗”距离近，它们都是宠物，与“汽车”距离远，相关性低。文档上给了创建 embeddings 的示例。将文本转换成向量能大大节省空间，可简单理解为索引，发送给 GPT API。 LlamaIndex 是更高一层 LangChain 的抽象，之前叫 GPT Index。之前的文章中的例子就是使用的 LlamaIndex 包。它简化了 LangChain 对文本分割、查询这块的接口，提供了更丰富的 Data Connector。LlamaIndex 只针对 GPT Model 做 Index，而 LangChain 是可以对接多个 LLMs，可扩展性更强。参考 https://gptindex.readthedocs.io/en/latest/ 。最近各家大厂接连放大招，AI 技术和应用突飞猛进，GPT4 接口已经支持最大 32K 输入，AI 的开发和使用门槛肯定会越来越低。垂直领域知识库的搭建和优化可能更多的是一个业务问题，而不是一个技术问题。欢迎关注公众号“越山集”，多交流。

我想做电商主图，用什么ai

如果您想制作电商主图，可以考虑以下几种 AI 工具和方法： 1. Midjourney：通过输入相关关键词，如“Guerlain Perfume,plant flowers,top light.cean natural backaround with water,saturation color scheme.The productis bright,Motled shading,studo lighfing,contrast high precision,Fine gloss,Centered composition,Photography,HD4Krealism–q 2–v 5–s 750–ar 9:16”，生成图片后再进行后期修改调整和文字排版。 2. Stable Diffusion：对于运营网店的女装店主，可采用局部重绘的方法。先真人穿衣服拍照，获取真实质感的照片，选好真人照片风格的底模，如 majicmixRealistic_v7，再根据不同平台需求换头，如面向海外市场换白女头，然后在图生图下的局部重绘选项卡下涂抹自己替换的部分，并设置相关的 prompts 和 parameters，如“breathtaking cinematic photo,masterpiece,best quality,,blonde hair,silver necklace,carrying a white bag,standing,full body,detailed face,big eyes,detailed hands”。

我想找一个好用的ai绘画，有什么推荐吗

以下是为您推荐的一些好用的 AI 绘画平台： 1. Midjourney：综合体验较好，尤其是其 v6 版本。 2. 可灵 AI：成熟的综合类工具。 3. 即梦 AI：成熟的综合类工具。 4. Krea：集成平台。 5. MewXAI：操作简单，功能丰富，包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址：https://www.mewxai.cn/

我想让我的论文降低AIGC使用率，请问我有什么具体可以操作的办法

以下是一些降低论文中 AIGC 使用率的具体操作办法： 1. 使用 AIGC 论文检测工具： Turnitin：广泛使用的学术剽窃检测工具，增加了检测 AI 生成内容的功能。使用方法是上传论文，系统会自动分析文本并提供详细报告，标示出可能由 AI 生成的部分。 Copyscape：主要用于检测网络上的剽窃行为，虽不是专门的 AIGC 检测工具，但能发现可能被 AI 生成的重复内容。输入文本或上传文档，系统会扫描网络查找相似或重复内容。 Grammarly：提供语法检查和剽窃检测功能，其剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中，选择剽窃检测功能，系统会提供分析报告。 Unicheck：基于云的剽窃检测工具，适用于教育机构和学术研究，能检测 AI 生成内容的迹象。上传文档或输入文本，系统会分析并生成报告，显示潜在的剽窃和 AI 生成内容。：专门设计用于检测 AI 生成内容的工具，使用先进算法分析文本，识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本，系统会提供详细报告。：提供免费的 AI 内容检测工具，可识别文本是否由 AI 生成。将文本粘贴到在线工具中，点击检测按钮，系统会提供分析结果。 GPTZero：专门设计用于检测由 GPT3 生成内容的工具，适用于教育和出版行业。上传文档或输入文本，系统会分析并提供报告。 Content at Scale：提供 AI 内容检测功能，帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中，系统会分析并提供结果。此外，为了从根本上降低 AIGC 使用率，您还需要注重自身的思考和研究，确保论文内容是基于您的独立见解和深入分析。

我想图生图，生成高清矢量图

以下是关于图生图生成高清矢量图的相关内容： ControlNet 参数：预处理器：canny，模型：control_v11p_sd15_canny 预处理器：lineart_standard，模型：control_v11p_sd15_lineart 放大高清大图：使用 Multi Diffusion + Tiled VAE + ControlNet Tile 模型将生成的图片发送到图生图，关键词种子会一并发送过去，重绘幅度建议 0.35，太高图片细节会发生变化 Lora 生图：点击预览模型中间的生图会自动跳转到相应页面模型上的数字代表模型强度，可在 0.6 1.0 之间调节，默认为 0.8 可自己添加 lora 文件，输入正向提示词，选择生成图片的尺寸（横板、竖版、正方形）采样器和调度器新手小白可默认，迭代步数在 20 30 之间调整，CFG 在 3.5 7.5 之间调整，随机种子 1 代表随机生成图生成的图会显示在右侧，若觉得某次生成结果不错，想要微调或高分辨率修复，可复制随机种子粘贴到相应位置确认合适的种子和参数想要高清放大，可点开高清修复，选择放大倍数，新手小白可默认算法，迭代步数建议在 20 30 之间，重绘幅度正常在 0.3 0.7 之间调整高清修复：文生图高清修复原理是命令 AI 按原来内容重新画一幅，新生成绘图和原绘图细节会不同，降低重绘幅度可更接近原图，如重绘幅度 0.7 时帽子和耳机有变化，0.3 时服饰细节接近但手部可能出现问题，可通过反复抽卡、图生图局部重绘或生成多张图片后 ps 合成等解决由于高清修复渲染耗时长，建议先低分辨率抽卡刷图，喜欢的图再用随机种子固定进行高清修复 SD 放大：文生图画好图后发送到图生图，点击脚本选择使用 SD 放大重绘幅度设置 0.3，放大倍率为 2，图块重叠像素设置为 64，原图尺寸加上重叠像素，如 512x768 变为 576x832，重绘幅度要保持较低数值，否则可能出现新人物

我想让DEEPSEEK帮我写一篇论文，题目已经定好了，怎么给他输入指令

以下是给 DeepSeek 输入指令以帮助您写论文的一些建议： 1. 采用结构化提示词：优先保留专业领域术语和技术词汇，这些术语通常具有高信息价值。对不同类型的信息设置权重，按优先级排序：任务定义>关键约束>专业术语>定量信息>方法论>背景。以完整语义单元为基本保留单位，而非单个词语，确保压缩后的内容仍保持语义完整性。避免详细指导思考过程，让模型自主生成思维链。 2. 高阶能力调用：文风转换矩阵：例如“用鲁迅杂文风格写职场 PUA 现象”“将产品说明书改写成《史记》列传格式”“把这篇论文摘要翻译成菜市场大妈能听懂的话”。领域穿透技术：如行业黑话破解“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 场景化实战策略：创意内容生成。技术方案论证。 4. 效能增强技巧：对话记忆管理：包括上下文锚定（如“记住当前讨论的芯片型号是麒麟 9010”）、信息回溯（如“请复述之前确认的三个设计原则”）、焦点重置（如“回到最初讨论的供应链问题”）。输出质量控制：针对过度抽象、信息过载、风格偏移等问题，使用相应的修正指令。 5. 特殊场景解决方案：长文本创作：可采用分段接力法，如“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。敏感内容处理：使用概念脱敏法（如“用经济学原理类比说明网络审查机制”）或场景移植法（如“假设在火星殖民地讨论该议题”）。在输入指令时，您需要清晰明确地描述论文的题目、研究目的、主要论点、关键论据、期望的结构和风格等重要信息，以便 DeepSeek 能够为您生成符合要求的内容。

我想要通过建筑草图生成效果图，有什么工具和流程可以使用

以下是使用悠船工具将建筑草图生成效果图的流程和相关介绍： 1. 基础使用：提示词：在右侧填写提示词，右上可下载对应图片。参数调整：参数详解参考下方「参数详解」。注意任何点击都会重新生成图片，免费用户可能会提示超出套餐，所以别乱点。最右侧是所有生成图片的略缩图。 2. 图片调整：变化：分为细微和强烈，细微改变幅度小，强烈改变幅度大。高清：有“直接”和“创意”两种模式，“直接”表示啥都不变直接出高清，“创意”表示在图片基础上进行微小的优化调整。风格变化：基于生成的图片作为上传图片（垫图）再创作。拓展：可上下左右拓展图片。缩放：指的是镜头，比如 2x 就是镜头拉远 2 倍。局部重绘：选择区域要大一些，太小的无法进行修改。 3. 图像参考：在悠船中可以利用垫图和提示词配合生成符合要求的建筑、风景、文物等。只需将图片复制到悠船的提示词框里面，并填写对应的提示词描述。

请帮我设计一个AI诗画长廊的logo

以下是为您设计 AI 诗画长廊 logo 的一些建议和参考：首先，如果您不确定如何设计，可以使用在线的 AI logo 生成器，例如 Logomaster.ai、Free Logo Design、Logo AI、Looka logo maker（原名 Logojoy）、Brandmark、DesignEvo、Tailor Brands、Designhill 等。其次，为您提供一份设计概要：项目名称：AI 诗画长廊 Logo 客户：日期：20230830 1. 目的：为 AI 诗画长廊创建一个强大且令人难忘的视觉标识。该 logo 应现代、专业且具有视觉吸引力。足够通用，能用于各种营销材料，如网站、名片和社交媒体页面。 2. 目标受众：对诗画与 AI 结合感兴趣的个人和团体。 logo 应通过传达创新、创意和艺术感来吸引受众。 3. 品牌属性：创新：体现不断探索和创新的精神。创意：反映出将诗画与 AI 独特结合的创造力。艺术感：展现诗画的艺术魅力和 AI 的科技感。 4. 设计规格：颜色：采用现代且吸引人的色彩组合，与目标受众相关。形状：使用简单、易记和识别的几何形状。字体：现代、无衬线字体，易于阅读和理解。 5. 审批流程：您将在收到设计后的 5 个工作日内给予设计师书面反馈以批准最终设计。 6. 附加信息：对任何创意想法持开放态度，期待共同创造出既美观又能有效传达 AI 诗画长廊价值的 logo。希望以上内容对您有所帮助。

如何让企业微信可以接上 AI？让我的企业微信号变成一个 AI 客服

要让企业微信接上 AI 并变成一个 AI 客服，可以参考以下内容： 1. 基于 COW 框架的 ChatBot 实现方案：这是一个基于大模型搭建的 Chat 机器人框架，可以将多模型塞进微信（包括企业微信）里。张梦飞同学写了更适合小白的使用教程，链接为：。可以实现打造属于自己的 ChatBot，包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能，以及常用开源插件的安装应用。正式开始前需要知道：本实现思路需要接入大模型 API 的方式实现（API 单独付费）。风险与注意事项：微信端因为是非常规使用，会有封号危险，不建议主力微信号接入；只探讨操作步骤，请依法合规使用，大模型生成的内容注意甄别，确保所有操作均符合相关法律法规的要求，禁止将此操作用于任何非法目的，处理敏感或个人隐私数据时注意脱敏，以防任何可能的滥用或泄露。支持多平台接入，如微信、企业微信、公众号、飞书、钉钉等；多模型选择，如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等；多消息类型支持，能处理文本、语音和图片，以及基于自有知识库进行定制的企业智能客服功能；多部署方法，如本地运行、服务器运行、Docker 的方式。 2. DIN 配置：先配置 FastGpt、OneAPI，装上 AI 的大脑后，可体验知识库功能并与 AI 对话。新建应用，在知识库菜单新建知识库，上传文件或写入信息，最后将拥有知识库能力的 AI 助手接入微信。

围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中，AI 面临着巨大挑战，如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法，利用价值网络评估棋面优劣，策略网络选择最佳落子，且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练，达到蒙特卡洛树搜索水平，并将其与蒙特卡洛树搜索有机结合，取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步，也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外，神经网络在处理未知规则方面具有优势，虽然传统方法在处理象棋问题上可行，但对于围棋则困难重重，而神经网络专门应对此类未知规则情况。关于这部分内容，推荐阅读《这就是 ChatGPT》一书，其作者备受推崇，美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。

什么AI工具可以实现提取多个指定网页的更新内容

以下 AI 工具可以实现提取多个指定网页的更新内容： 1. Coze：支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容，可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时，输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序，标注要采集的内容，内容上传成功率高。 2. AI Share Card：能够一键解析各类网页内容，生成推荐文案，把分享链接转换为精美的二维码分享卡。通过用户浏览器，以浏览器插件形式本地提取网页内容。

以下是关于文字生成视频（文生视频）的相关信息：一些提供文生视频功能的产品： Pika：擅长动画制作，支持视频编辑。 SVD：Stable Diffusion 的插件，可在图片基础上生成视频。 Runway：老牌工具，提供实时涂抹修改视频功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多相关网站可查看：https://www.waytoagi.com/category/38 。制作 5 秒单镜头文生视频的实操步骤（以梦 AI 为例）：进入平台：打开梦 AI 网站并登录，新用户有积分可免费体验。输入提示词：涵盖景别、主体、环境、光线、动作、运镜等描述。选择参数并点击生成：确认提示词无误后，选择模型、画面比例，点击「生成」按钮。预览与下载：生成完毕后预览视频，满意则下载保存，不理想可调整提示词再试。视频模型 Sora：OpenAI 发布的首款文生视频模型，能根据文字指令创造逼真且充满想象力的场景，可生成长达 1 分钟的一镜到底超长视频，视频中的人物和镜头具有惊人的一致性和稳定性。

Ai在设备风控场景的落地

AI 在设备风控场景的落地可以从以下几个方面考虑：法律法规方面：《促进创新的人工智能监管方法》指出，AI 的发展带来了一系列新的安全风险，如对个人、组织和关键基础设施的风险。在设备风控中，需要关注法律框架是否能充分应对 AI 带来的风险，如数据隐私、公平性等问题。趋势研究方面：在制造业中，AI Agent 可用于生产决策、设备维护、供应链协调等。例如，在工业设备监控与预防性维护中，Agent 能通过监测传感器数据识别异常模式，提前通知检修，减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面，AI Agent 也能发挥重要作用，实现生产的无人化、决策的数据化和响应的实时化。

以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总： 4 月 11 日： Pika 上线 Pika Twists 能力，可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中，结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术，可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术，实现从单张图片快速生成超逼真的 3D 头像，在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage，通过图片生成可自由拼装 3D 场景，再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型，无缝支持各种视频生成任务（文本/图像/视频到视频）。 4 月 9 日： ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下，可生成完整的 1 分钟视频。 4 月 14 日：字节发布一款经济高效的视频生成基础模型 Seaweed7B。可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。