我想做一个猫咪做饭的短视频，有五个分镜头。我先用文生图生成图片，在用图片生成视，最后剪辑在一起。问题是文生图的时候，生成的图片，效果不太理想

Answer

以下是为您提供的一些可能有助于改善文生图效果不理想问题的建议：

仔细检查您输入的画面描述，确保描述清晰、具体、准确，包含足够的细节和特征，以便模型更好地理解您的需求。
尝试调整关键词和描述的侧重点，突出您想要的关键元素，比如猫咪做饭的动作、表情、厨房环境等。
更换不同的文生图模型或工具，有些模型可能在某些特定类型的图像生成上表现更出色。
参考其他优秀的类似主题的图像，学习其构图、色彩、光影等方面的处理方式，从而优化您的画面描述。
多次尝试生成，并对每次生成的结果进行分析和总结，找出问题所在，逐步改进描述。

Content generated by AI large model, please carefully verify (powered by aily)

References

多镜头，以下初表的完成度差不多在70%。|分镜序号|制作人|景别|运镜|画面描述|生图内容只看这列|画面初稿|修改意见|修改画面|画面终稿|人物对话|画外音||-|-|-|-|-|-|-|-|-|-|-|-||6.5||近景|缓慢拉远|近景，与6.3同画面。但是视角为水平。餐桌旁，小男孩仰着脸，捧着吃光了的饭碗，身后慢慢叠化出小男孩长大成16岁的少年的样子。镜头拉远。|近景，与6.3同画面。但是视角为水平。餐桌旁，小男孩仰着脸，捧着吃光了的饭碗，身后慢慢叠化出小男孩长大成16岁的少年的样子。|||||小男孩：我会好好吃饭|||6.6||中景|缓慢拉远|背景虚化，可是是明亮或者柔和的光。与6.5同画面又叠化出一群少年群像|背景虚化，可是是明亮或者柔和的光。与6.5同画面又，叠化出一群少年群像|||||爷爷，我们会快快长大|||6.7||近景|静态|叠化至近景，袁隆平的笑脸。|近景，袁隆平慈祥的笑脸|||||||

Others are asking

以下是关于文生图的简易上手教程： 1. 定主题：确定您需要生成的图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint：根据主题选择内容贴近的模型，如麦橘、墨幽的系列模型，如麦橘写实、麦橘男团、墨幽人造人等。 3. 选择 lora：在生成内容基础上，寻找重叠的 lora 以控制图片效果和质量，可参考广场上好看的帖子。 4. ControlNet：可控制图片中特定图像，如人物姿态、生成特定文字等，属于高阶技能。 5. 局部重绘：下篇再教。 6. 设置 VAE：无脑选择 840000 即可。 7. Prompt 提示词：用英文写想要 AI 生成的内容，使用单词和短语组合，用英文半角逗号隔开，不用管语法和长句。 8. 负向提示词 Negative Prompt：用英文写想要 AI 避免产生的内容，同样是单词和短语组合，用英文半角逗号隔开，不用管语法。 9. 采样算法：一般选 DPM++2M Karras 较多，也可参考 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数：选 DPM++2M Karras 时，采样次数一般在 30 40 之间。 11. 尺寸：根据个人喜好和需求选择。以下是一些常见的文生图工具和模型： 1. 腾讯混元 2. luma 3. Recraft 4. 文生图大模型 V2.1L（美感版） 5. 美图奇想 5.0 6. midjourney 7. 快手可图 8. Flux.1.1 9. Stable Diffusion 3.5 Large 10. Imagen 3 网页版

以下是文生图大模型的排名（从高到低）： 1. Imagen 3：真实感满分，指令遵从强。 2. Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。 3. Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。 4. 快手可图：影视场景能用，风格化较差。 5. Flux.1.1：真实感强，需要搭配 Lora 使用。 6. 文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。 7. Luma：影视感强，但风格单一，糊。 8. 美图奇想 5.0：AI 油腻感重。 9. 腾讯混元：AI 油腻感重，影视感弱，空间结构不准。 10. SD 3.5 Large：崩。