Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

如何用现有人的照片生成拜年短视频

Answer

以下是用现有人的照片生成拜年短视频的流程：

拍摄训练的图片：先拍好所需图片。
使用 EasyPhoto 开始训练：放入图片开始炼丹，等待显示“The training has been completed.”表示完成。
训练好的 lora 用来推理：开始推理，注意推理使用的底图尽量选择和自己外形、头发相似的图片，因为除了面部，发型等也是关键。
先用 Stable different 脸一个自己脸部的 Lora，然后生成各种不同风格的图片。
配音。
在 heygen 里面让图片口型和配音对上。
后期剪辑。
封面制作。

制作最后的拜年祝福语，希望以上工作流能对您有所帮助。

Content generated by AI large model, please carefully verify (powered by aily)

References

《回家过年》视频制作流程

制作最后的拜年祝福语，这边分享一下工作流。希望能对大家有些许帮助。先用Stable different脸一个自己脸部的Lora，然后生成各种不同风格的图片。配音在heygen里面让图片口型和配音对上。[heading4]第一步【拍摄训练的图片】[content]先拍好图片[heading4]第二步【使用EasyPhoto】开始训练[content]放入开始炼丹,需要等待一段时间。显示The training has been completed.就是完成了。[heading4]第三步【训练好的lora用来推理】[content]然后开始推理，下面是我推理设置的参数。这里推理使用的底图要注意一下，尽量出和自己外形，如果头发相似的图片。因为像不像，除了面部，发型这些也是关键。[heading2]后期剪辑[heading2]封面制作

Others are asking

人工智能设计拜年PPT的软件

以下是一些可以用于人工智能设计拜年 PPT 的软件： 1. Gamma：在线 PPT 制作网站，可通过输入文本和想法提示快速生成幻灯片，支持嵌入多媒体格式，如 GIF 和视频，增强演示文稿吸引力，网址：https://gamma.app/ 2. 美图 AI PPT：由美图秀秀开发团队推出，通过输入简单文本描述生成专业 PPT 设计，包含丰富模板库和设计元素，适用于多种场合，网址：https://www.xdesign.com/ppt/ 3. Mindshow：AI 驱动的 PPT 辅助工具，提供自动布局、图像选择和文本优化等智能设计功能，还可能包含互动元素和动画效果，网址：https://www.mindshow.fun/ 4. 讯飞智文：科大讯飞推出的 AI 辅助文档编辑工具，利用语音识别和自然语言处理技术优势，提供智能文本生成、语音输入、文档格式化等功能，网址：https://zhiwen.xfyun.cn/ 此外，还有以下相关内容： 1. 2024 年 6 月 22 日更新的一批研究报告，如《》等。 2. 熊猫 Jay 编写的超全的 AI 工具生成 PPT 的思路和使用指南，介绍了 MindShow、爱设计、闪击、Process ON、WPS AI 等工具，并因该培训获得 1000 元奖励。原文：https://mp.weixin.qq.com/s/uVoIIcePa7WTx7GNqkAPA 公众号：熊猫 Jay 字节之旅

ai写拜年视频拍摄脚本

以下是为您生成的拜年视频拍摄脚本的相关内容：创作思路：讲述一个外出打工的人春节回家过年的故事，按照回家过年的时间线，从启程回家到家人团圆。营造过年场景，展现春节的喜庆吉祥，制作成贺岁的 MV。引起情感共鸣，突出贺岁、欢度新春的氛围，展现热闹的新年场景，强调满满的年味儿。视频风格：电影感、真实感。视频时长：35 秒以上。视频构思：从启程回家到家人团圆，展现不同的春节场景，以贺岁的 MV 形式呈现，满满的过年喜庆感，最后加入自己的数字人分身拜年结尾。视频比例：16:9 使用工具： Midjourney Stable diffusion Runway PixVerse heygen 剪映使用 ChatGPT 列出大纲：可作为思维框架激发创意，每个镜头内容可根据自身想法创意编写提示词出图。主角形象设计（18 岁左右）：外观特征：男性，约 18 岁，充满青春活力和冒险精神。发型为时髦的短发，可能有亮银色或电光蓝等潮流染色。面容有明亮且充满好奇的眼神。服装：结合未来科技感和青年流行元素，主要色调为活泼的颜色如蓝色、绿色或银色，与黑色或灰色相搭配，材质为轻便的高科技材料。装备：智能手表具有通讯、导航和游戏功能，多功能背包内含必要的探险工具和个人物品，特殊眼镜有增强现实功能。性格特征：充满好奇心和创造力，冒险且自信，友好且乐于交流。背景故事简介：对科技和神秘传说感兴趣，因网络上关于《山海经》神兽的线索决定踏上寻找真相的旅程。节目单：数字人及互动类： AI 还你真正假期：数字游民 AI 生活 Vlog。包括真实 vlog 记录、生活感想分享、AIGC 如何改变了自己。亲情节目：送给家人的节目。包含亲情脚本、共情，一年工作辛苦相关内容，以及互动留言、表白墙。结尾祝福与展望：新春快乐的祝福。图片：观众互动海报生成：实时生成祝福海报。包括文字变文字图片、图片变祝福、预录的 10 条祝福、毛笔字。观众头像生成：实时互动制作头像。包括预生成图片、Lora、有限制的提示词。

如何借鉴“决战拜年之巅”：这是一款基于 GLM 大模型开发的微信小程序游戏，玩家在 10 个 AI 角色组成的家人群里，面对“七大姑八大姨”的连环拷问，自由对话打出属于自己的结局。实现一个工作场合的游戏

以下是借鉴“决战拜年之巅”实现一个工作场合游戏的相关要点： 1. 开发背景：“决战拜年之巅”是参加 Globalgamejam 游戏比赛时，在 48 小时内开发的，主题源于“make me laugh”，产品负责人谐音想到江浙沪孝子排行榜的“孝”，结合春节想到做类似拜年的东西。 2. 火爆情况：在参赛群发布半成品后，在 QQ、微信迅速火爆，两天内有 200 万用户，最高峰同时在线 6 万人，服务器一度支持不了，凌晨才做好调整，后续有厂商赞助服务器，上线约一周。 3. 游戏特点：基于 GLM 大模型开发，又称过年模拟器，玩家在 10 个 AI 角色组成的家人群里，面对“七大姑八大姨”的连环拷问自由对话打出结局。 4. 借鉴要点：明确创新主题和玩法，结合特定场景和需求。注重用户体验，及时应对服务器等技术支持问题。利用 AI 技术实现角色互动和自由对话。需要注意的是，“决战拜年之巅”被认为可能是一个 chatbot 而非严格意义上的游戏。在设计工作场合的游戏时，要明确以下三个点：（具体要点未在提供的内容中明确）

以下是关于文字生成视频（文生视频）的相关信息：一些提供文生视频功能的产品： Pika：擅长动画制作，支持视频编辑。 SVD：Stable Diffusion 的插件，可在图片基础上生成视频。 Runway：老牌工具，提供实时涂抹修改视频功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多相关网站可查看：https://www.waytoagi.com/category/38 。制作 5 秒单镜头文生视频的实操步骤（以梦 AI 为例）：进入平台：打开梦 AI 网站并登录，新用户有积分可免费体验。输入提示词：涵盖景别、主体、环境、光线、动作、运镜等描述。选择参数并点击生成：确认提示词无误后，选择模型、画面比例，点击「生成」按钮。预览与下载：生成完毕后预览视频，满意则下载保存，不理想可调整提示词再试。视频模型 Sora：OpenAI 发布的首款文生视频模型，能根据文字指令创造逼真且充满想象力的场景，可生成长达 1 分钟的一镜到底超长视频，视频中的人物和镜头具有惊人的一致性和稳定性。

以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总： 4 月 11 日： Pika 上线 Pika Twists 能力，可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中，结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术，可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术，实现从单张图片快速生成超逼真的 3D 头像，在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage，通过图片生成可自由拼装 3D 场景，再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型，无缝支持各种视频生成任务（文本/图像/视频到视频）。 4 月 9 日： ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下，可生成完整的 1 分钟视频。 4 月 14 日：字节发布一款经济高效的视频生成基础模型 Seaweed7B。可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。

以下是为您提供的 AI 视频教学相关内容： 1. 第一节回放 AI 编程从入门到精通：课程安排：19、20、22 和 28 号四天进行 AI 编程教学，周五晚上穿插 AI 视频教学。视频预告：周五晚上邀请小龙问露露拆解爆火的 AI 视频制作，视频在视频号上有大量转发和播放。编程工具 tree：整合多种模型，可免费无限量试用，下载需科学上网，Mac 可拖到文件夹安装，推荐注册 GitHub 账号用于代码存储和发布，主界面分为工具区、AI 干活区、右侧功能区等。网络不稳定处理：网络不稳定时尝试更换节点。项目克隆与文件夹：每个项目通过在本地新建文件夹来区分，项目运行一轮一轮进行，可新建会话，终端可重开。 GitHub 仓库创建：仓库相当于本地项目，可新建，新建后有地址，可通过多种方式上传。 Python 环境安装：为方便安装提供了安装包，安装时要选特定选项，安装后通过命令确认。代码生成与修改：在 tree 中输入需求生成代码，可对生成的代码提出修改要求，如添加滑动条、雪花形状、颜色等，修改后审查并接受。 2. AI 视频提示词库：神秘风 Arcane：Prompt：a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego：Prompt：a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background：Prompt：a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli：Prompt：a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk：Prompt：a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism：Prompt：a robot is walking through a destroyed city,,big movements

目前全世界最厉害的对视频视觉理解能力大模型是哪个

目前在视频视觉理解能力方面表现出色的大模型有： 1. 昆仑万维的 SkyReelsV1：它不仅支持文生视频、图生视频，还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作。擅长万物识别，能分析图像中的文本、图表、图标、图形和布局等。

目前全世界最厉害的视频视觉理解大模型是哪个

目前全世界较为厉害的视频视觉理解大模型有以下几个： 1. 昆仑万维的 SkyReelsV1：不仅支持文生视频、图生视频，是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元：语义理解能力出色，能精准还原复杂的场景和动作，如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5：全球最快的 AI 视频生成模型，Turbo 模式下可在 10 秒内生成视频，最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能，具备顶尖动漫生成能力。

需要做一个自动化出视频的工作流

以下是一个关于自动化出视频工作流的详细介绍：优势：全自动化处理，解放双手。 40 秒快速出片，效率提升。成本低廉，每条仅需 0.0x 元。输出质量稳定专业。 DeepseekR1 保证文案质量。还能改进，例如可以加入配套 BGM，让视频更有感染力；增加更丰富的画面内容和转场效果；使用免费节点替代付费插件，进一步降低成本；优化模板样式，支持更多展示形式；增加自动化程度，支持批量处理。工作流程： 1. 可以在扣子商店体验，建议自己搭建。 2. 工作流调试完成后，加入到智能体中，可以选择工作流绑定卡片数据，智能体则通过卡片回复。 3. 选择发布渠道，重点如飞书多维表格，填写上架信息（为了快速审核，选择仅自己可用），确认发布等待审核，审核通过后即可在多维表格中使用。 4. 创建飞书多维表格，添加相关字段，配置选择“自动更新”，输入相关字段后，“文案视频自动化”字段捷径会自动调用工作流，生成视频。 5. 表单分享，实现“填写表单，自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件，一键导出成品。但需注意节点产生的视频是异步生成，可能无法马上展现，需耐心等待几秒。如果您还有其他疑问或需要进一步的帮助，请随时联系。

旧照片修复

旧照片修复是 AI 绘画领域中的一项重要应用。以下是关于旧照片修复的一些相关信息：以往解决旧照片修复问题往往需要搭建极为复杂的工作流，现在 GPT 4O 只需要一句话就可以实现。图像放大修复是 AI 绘画领域必不可少的一部分，利用 AI 技术进行图像修复，可以让模糊的旧照片重现清晰，保留珍贵回忆。例如，以前手机拍摄的低分辨率图片，放到如今智能手机上观看会非常模糊，这时可用 AI 技术进行高清修复。 ComfyUI 结合特定工作流，只需十几个基础节点就能实现较好的老照片修复效果。参数调节方面，一般先确认放大倍数，然后根据出来的图片调整 controlNet 的强度。 Flux.1dev ControlNet 是为低分辨率图像开发的模型，可直接与 diffusers 库一起使用，采用合成复杂数据退化方案进行训练，目的是让模型学会处理各种真实世界中可能遇到的图像退化情况。 Flux Ultimator 能增加小细节，增强色彩，在 0.1 的强度设置下也有显著效果，能顺利集成到工作流程中，与其他 LORA 结合使用时强度需小于 0.5。若图片质量细节不够，可选择 T5 Clip 的 fp16 版本。

如果改变照片中人物的表情

要改变照片中人物的表情，可以通过以下几种方式： 1. 在使用 SD 脸部修复插件 After Detailer 时，输入如“伤心、流泪”这样针对表情的正负提示词，人物的表情会进行相应改变。但输入“带着墨镜”可能没有效果。 2. 使用 Magic Brush 工具，选中人物的眉毛、眼睛、嘴唇等部位，通过调节轨迹的方向来实现合理的表情变化。 3. 在 Midjourney V6 中，若遇到无法改变角色脸部等问题，可按照以下步骤排除故障：首先确保写了强有力的提示以建议新的姿势、风格或细节；若角色抗拒被操纵，可能是 cref 图像支配了提示，可通过使用 cw进行处理，尝试将提示与较低的 cref 权重一起使用，如 cw 60，按照特定步骤操作，还可考虑使用来恢复面部区域。

老照片修复

老照片修复是一个具有一定复杂性但通过 AI 技术可以实现较好效果的领域。以下是一些相关信息：在解决老照片修复问题上，以往 AI 往往需要搭建极为复杂的工作流，而现在 GPT 4O 只需要一句话就可以实现。对于老照片上色，可启用 MutiDiffusion 插件，不开放大倍数，仅使用分块渲染功能，在显存不够的情况下将图片放大到足够倍数。对于复杂的老照片，如人物多、场景复杂、像素低的情况，可在 PS 里进行角度调整和照片裁切，然后上色。若直接上色效果不佳，可放弃人物服装颜色指定，只给场景方向，让 AI 自行决定。还可加入第二个 controlnet 来控制颜色，使用 t2ia_color 模型，给出简单关键词如“蓝天、绿树、灰石砖”。 ComfyUI 老照片修复结合 Flux Controlnet Upscale 工作流，以前的工作流较复杂，现在只要十几个基础节点就能实现同样甚至更好的效果。一般先确认放大倍数，再根据图片调整 controlNet 的强度。Flux.1dev ControlNet 是为低分辨率图像开发的模型，可直接与 diffusers 库一起使用，采用特定训练方式处理各种真实世界中可能遇到的图像退化情况。Flux Ultimator 能增加小细节和放大色调丰富性、深度，在 0.1 强度设置下有显著增强效果，能顺利集成到工作流程中，与其他 LORA 结合使用时强度需小于 0.5。若图片质量细节不够，可选择 fp16 版本的 T5 Clip。

老照片变高清

以下是使用 AI 将老照片变高清的步骤： 1. 给老照片上色：为做到颜色与内容统一，可启用 cutoff 插件，按顺序设置好颜色提示词。不了解该插件的可参考文章。 2. 使照片人脸变清晰：将照片放入后期处理，使用 GFPGAN 算法，可参考文章。但此步骤无法使头发、衣服等元素变清晰。 3. 放大照片：将图片发送到图生图中，打开 stableSR 脚本，放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的，可参考文章。切换到 sd2.1 的模型进行修复，vae 选择 vqgan，提示词可不写以免干扰原图。 4. 显存不够时：启用 MutiDiffusion 插件，不开放大倍数，仅使用分块渲染功能帮助放大图片。 5. 处理复杂照片：对于人物多、场景复杂、像素低的照片，可先在 ps 里调整角度和裁切，然后上色。若直接上色效果不佳，可放弃人物服装颜色指定，只给场景方向，让 AI 自行决定。还可加入第二个 controlnet 控制颜色，使用 t2ia_color 模型，给出简单关键词，如“蓝天、绿树、灰石砖”。最后进行脸部修复和放大。

如何让老照片变清晰

以下是让老照片变清晰的方法： 1. 将照片放入后期处理中，使用 GFPGAN 算法使人脸变清晰。您可以参考文章。 2. 将图片发送到图生图中，打开 stableSR 脚本，放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章。 3. 切换到 sd2.1 的模型进行修复，vae 选择 vqgan，提示词可以不写以免对原图产生干扰。 4. 启用 MutiDiffusion 插件，不开放大倍数，仅使用分块渲染的功能，能在显存不够的情况下将图片放大到足够的倍数。 5. 对于复杂的照片，可先在 ps 里面进行角度调整和照片裁切，然后使用上述步骤进行上色。若直接上色效果不佳，可放弃人物服装的颜色指定，只给场景方向，让 AI 自行决定。还可加入第二个 controlnet 来控制颜色，使用 t2ia_color 的模型，给出简单的关键词，如“蓝天、绿树、灰石砖”。另外，进行超清无损放大修复需要准备以下文件和操作： 1. 使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型，放入 stablediffusionwebui/models/StableDiffusion/文件夹中。 2. 将 StableSR 模块（约 400M 大小）放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。 3. 将 VQVAE（约 750MB 大小）放在 stablediffusionwebui/models/VAE 中。

老照片修复

老照片修复是一项具有一定复杂性的工作，但随着 AI 技术的发展，实现方式也在不断改进和优化。以往，AI 在解决老照片修复问题时，往往需要搭建极为复杂的工作流。而现在，例如 GPT 4O 只需要一句话，就可以实现部分修复需求。在具体的修复方法中，如使用 SD 进行老照片上色，可以启用 MutiDiffusion 插件，不开放大倍数，仅使用分块渲染的功能，在显存不够的情况下将图片放大到足够的倍数。对于复杂的老照片，如人物多、场景复杂、像素低的情况，可以先在 ps 里面进行角度调整和照片裁切，然后进行上色。若直接上色效果不佳，可放弃人物服装的颜色指定，只给场景方向，让 AI 自行决定，还可加入第二个 controlnet 来控制颜色。 ComfyUI 老照片修复结合 Flux Controlnet Upscale 工作流，以前复杂的工作流现在只要十几个基础的节点就能实现同样的效果甚至更好。其中涉及参数的调节，一般先确认放大的倍数，然后根据出来的图片来调整 controlNet 的强度。Flux.1dev ControlNet 是为低分辨率图像开发的模型，可直接与 diffusers 库一起使用，采用合成复杂数据退化方案进行训练。Flux Ultimator 能增加小细节和放大色调的丰富性和深度，在 0.1 的强度设置下也能有显著增强效果，能顺利集成到工作流程中。若图片质量细节不够，T5 Clip 选择 fp16 的版本。

生成提示词的提示词

以下是关于生成提示词的相关内容：生成提示词的思路和方法：可以根据效果好的图片中的高频提示词去反推效果，结合不同字体效果的描述，打包到一组提示词中。提示词给到 AI 后，AI 会根据给定文字的文义，判断适合的情绪风格，然后给出适合情绪的字体和风格描述、情感氛围等，加上一些质量/品质词，形成输出提示词结构。为了让 AI 更能描述清晰风格，可以先给定多种参照举例。具体操作步骤：打开 AI 工具的对话框，将相关提示词完整复制粘贴到对话框。推荐使用 ChatGPT 4o。当 AI 回复后，发送您想要设计的文字。可以仅发送想要的文字，也可以发送图片（适合有多模态的 AI）让 AI 识别和反推。将 AI 回复的提示词部分的内容复制到即梦 AI。对生成提示词的一些观点：提示词生成提示词并非必要，不一定能生成最好的 Prompt 框架，修改过程可能耗时且不一定能修改好，不如花钱找人写。一句话生成完整符合需求的 Prompt 非常困难，只能大概给出框架和构思，需要更低成本地调整需求和修改 Prompt。不同生图工具生成提示词的特点：即使是简短的描述，生成的提示词也非常细节、专业。会解析需求，找出核心要点和潜在的诠释点，并给出不同的提示词方案。提示词构建更多在于增强，而不是发散，生成的内容更符合期望。同时生成中、英双版本，国内外工具通用无压力。 14 款 AI 生图工具实测对比：本次实测用到的工具包括国内版的即梦 3.0（https://jimeng.jianying.com/aitool/home）、WHEE（https://www.whee.com）、豆包（https://www.doubao.com/chat）、可灵（https://app.klingai.com/cn/texttoimage/new）、通义万相（https://tongyi.aliyun.com/wanxiang/creation）、星流（https://www.xingliu.art）、LibiblibAI（https://www.liblib.art），以及国外版的相关工具。

有没有能根据描述，生成对应的word模板的ai

目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如：在法律领域，您可以提供【案情描述】，按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件，模拟不同辩护策略下的量刑结果，对比并推荐最佳辩护策略，或者为商业合同纠纷案件设计诉讼策略等。在 AI 视频生成方面，有结构化的提示词模板，包括镜头语言（景别、运动、节奏等）、主体强化（动态描述、反常组合等）、细节层次（近景、中景、远景等）、背景氛围（超现实天气、空间异常等），以及增强电影感的技巧（加入时间变化、强调物理规则、设计视觉焦点转移等）。一泽 Eze 提出的样例驱动的渐进式引导法，可利用 AI 高效设计提示词生成预期内容。先评估样例，与 AI 对话让其理解需求，提炼初始模板，通过多轮反馈直至达到预期，再用例测试看 AI 是否真正理解。但需要注意的是，不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化，以获得更符合期望的 word 模板。

如何自动生成文案

以下是几种自动生成文案的方法： 1. 基于其它博主开源的视频生成工作流进行优化：功能：通过表单输入主题观点，提交后自动创建文案短视频，创建完成后推送视频链接到飞书消息。涉及工具：Coze 平台（工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成）、飞书（消息）、飞书多维表格（字段捷径、自动化流程）。大体路径：通过 coze 创建智能体，创建工作流，使用 DeepSeek R1 根据用户观点创建文案，再创建视频；发布 coze 智能体到飞书多维表格；在多维表格中使用字段捷径，引用该智能体；在多维表格中创建自动化流程，推送消息给指定飞书用户。 2. 生成有趣的《图文短句》：实现原理：先看工作流：包括第一个大模型生成标题、通过“代码节点”从多个标题中获取其中一个（可略过）、通过选出的标题生成简介、通过简介生成和标题生成文案、将文案进行归纳总结、将归纳总结后的文案描述传递给图像流。再看图像流：包括提示词优化、典型的文生图。最终的 Bot 制作以及预览和调试。 3. 腾讯运营使用 ChatGPT 生成文案：步骤：通过 ChatGPT 生成文案，将这些文案复制到支持 AI 文字转视频的工具内，从而实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频，系统匹配的素材不符合要求时可以手动替换。例如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类 AI 视频制作工具让普罗大众生产视频变得更轻松上手。

如何通过输入一些观点，生成精彩的口播文案

以下是通过输入观点生成精彩口播文案的方法： 1. 基于其它博主开源的视频生成工作流进行功能优化，实现视频全自动创建。效果展示：可查看。功能：通过表单输入主题观点，提交后自动创建文案短视频，并将创建完成的视频链接推送至飞书消息。涉及工具：Coze平台（工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成）、飞书（消息）、飞书多维表格（字段捷径、自动化流程）。大体路径：通过 coze 创建智能体，创建工作流，使用 DeepSeek R1 根据用户观点创建文案，再创建视频。发布 coze 智能体到飞书多维表格。在多维表格中使用字段捷径，引用该智能体。在多维表格中创建自动化流程，推送消息给指定飞书用户。 2. 智能体发布到飞书多维表格：工作流调试完成后，加入到智能体中，可以选择工作流绑定卡片数据，智能体则通过卡片回复。选择发布渠道，重点是飞书多维表格，填写上架信息（为快速审核，选择仅自己可用），等待审核通过后即可在多维表格中使用。 3. 多维表格的字段捷径使用：创建飞书多维表格，添加相关字段，配置后使用字段捷径功能，使用自己创建的 Coze 智能体。表单分享，实现填写表单自动创建文案短视频的效果。 4. 自动化推送：点击多维表格右上角的“自动化”，创建所需的自动化流程。另外，伊登的最新 Deepseek+coze 实现新闻播报自动化工作流如下：第一步是内容获取，只需输入新闻链接，系统自动提取核心内容。开始节点入参包括新闻链接和视频合成插件 api_key，添加网页图片链接提取插件，获取网页里的图片，以 1ai.net 的资讯为例，添加图片链接提取节点，提取新闻主图，调整图片格式，利用链接读取节点提取文字内容，使用大模型节点重写新闻成为口播稿子，可使用 Deepseek R1 模型生成有吸引力的口播内容，若想加上自己的特征，可在提示词里添加个性化台词。

小红书图文批量生成

以下是关于小红书图文批量生成的详细内容：流量密码！小红书万赞英语视频用扣子一键批量生产，这是一个保姆级教程，小白都能看得懂。原理分析：决定搞之后，思考生成这种视频的底层逻辑，进行逆推。这种视频由多张带文字图片和音频合成，带文字图片由文字和图片生成，文字和图片都可由 AI 生成，音频由文字生成，文字来源于图片，也就是说，关键是把图片和文字搞出来。逻辑理清后，先找好看的模版，未找到好看的视频模版，最后看到一个卡片模版，先把图片搞出来，才有资格继续思考如何把图片变成视频，搞不出来的话，大不了不发视频，先发图片，反正图片在小红书也很火。拆模版：要抄这种图片，搞过扣子的第一反应可能是用画板节点 1:1 去撸一个，但扣子的画板节点很难用，Pass 掉。用 PS 不行，太死板不灵活，html 网页代码可以，非常灵活。经过 2 个多小时和 AI 的 battle，用 html 代码把图片搞出来了。这里不讲代码怎么写，直接抄就行。要抄，首先要学会拆，不管用什么方式批量生成这样的图片，都必须搞清楚里面有哪些是可以变化的参数，也就是【变量】，如主题、主题英文、阶段、单词数、图片、正文、翻译、普通单词、重点单词等。想方法：大概知道批量生成这样的图片需要搞清楚哪些参数，图片用 html 代码搞出来了。但问题是视频怎么搞，这种视频由多张不同的【带文字的图片】生成，比如读到哪句，哪句就高亮起来，图片也可以随着读到的句子变更。最后，视频就是用这样的图片一张张拼起来的。

ai如何什么生成表格

AI 生成表格通常可以通过以下技术实现： 1. 利用变分自编码器（VAEs）和序列到序列模型（Seq2Seq）等技术生成表格文件、表格公式，并清理、创建、转换和分析表格中的文本数据，例如表格结构设计、数据分析表、表格自动化等。 2. 借助一些办公软件中的 AI 插件，如飞书中的相关插件，先通过 AI 理解图片中的内容并填充到表格列中，然后利用自带插件总结生成相关指令。此外，在多模态数据生成中，结构化数据生成包括表格生成，多模态合成数据从大类来看有非结构化数据（图片、视频、语音等）和结构化数据（表格等）两大类。非结构化数据生成包括文本生成、图像生成、音频和语音生成、视频生成、3D 生成、合成数据生成等。