Chat with Wiki - 图生文怎么制作

Answer

以下是关于图生文制作的详细步骤：

一、Tusiart 简易上手教程

定主题：明确您需要生成的图片的主题、风格和要表达的信息。
选择基础模型 Checkpoint：根据主题，选择内容贴近的 checkpoint，如麦橘、墨幽的系列模型，如麦橘写实、麦橘男团、墨幽人造人等。
选择 lora：基于生成内容，寻找重叠的 lora 以控制图片效果和质量，可参考广场上好看帖子中使用的 lora。
ControlNet：用于控制图片中的特定图像，如人物姿态、特定文字、艺术化二维码等，属于高阶技能，可后续学习。
局部重绘：下篇再教。
设置 VAE：无脑选择 840000 这个即可。
Prompt 提示词：用英文写想要 AI 生成的内容，使用单词和短语组合，用英文半角逗号隔开，无需管语法和长句。
负向提示词 Negative Prompt：用英文写想要 AI 避免产生的内容，同样是单词和短语组合，用英文半角逗号隔开，无需语法。
采样算法：一般选 DPM++2M Karras 较多，也可留意 checkpoint 详情页上模型作者推荐的采样器。
采样次数：选 DPM++2M Karras 后，采样次数在 30 - 40 之间，过多意义不大且慢，过少出图效果差。
尺寸：根据个人喜好和需求选择。

二、Liblibai 简易上手教程

定主题：确定要生成的图片的主题、风格和表达信息。
选择 Checkpoint：依照主题找贴近的 checkpoint，如麦橘、墨幽的系列模型。
选择 lora：寻找与生成内容重叠的 lora 来控制图片效果和质量，参考广场上的优秀帖子。
设置 VAE：无脑选 840000 那一串。
CLIP 跳过层：设成 2 。
Prompt 提示词：用英文写想要 AI 生成的内容，单词和短语组合，用英文半角逗号隔开，不管语法和长句。
负向提示词 Negative Prompt：用英文写想要 AI 避免产生的内容，单词和短语组合，用英文半角逗号隔开，不管语法。
采样方法：一般选 DPM++2M Karras 较多，留意 checkpoint 详情页上模型作者推荐的采样器。
迭代步数：选 DPM++2M Karras 后，在 30 - 40 之间，过多意义不大且慢，过少出图效果差。
尺寸：根据个人喜好和需求选择。
生成批次：默认 1 批。

三、SD 新手入门图文教程

CFG Scale（提示词相关性）：决定图像与提示的匹配程度，增加该值会使图像更接近提示，但可能降低图像质量，可用更多采样步骤抵消，一般开到 7 - 11 ，过高会有粗犷线条和过锐化图像。
生成批次：每次生成图像的组数，一次运行生成图像的数量为“批次×批次数量”。
每批数量：同时生成的图像个数，增加会提高性能但需更多显存，若显存未超 12G ，保持为 1 。
尺寸：指定图像长宽，出图尺寸太宽可能出现多个主体，1024 以上尺寸可能效果不理想，推荐小尺寸分辨率+高清修复（Hires fix) 。
种子：决定模型生成图片时的随机性，初始化 Diffusion 算法起点的初始值，相同参数下应生成相同图片。
高清修复：通过勾选“Highres.fix”启用，默认高分辨率下会生成混沌图像，使用后先按指定尺寸生成再放大，实现高清大图效果，最终尺寸为（原分辨率×缩放系数 Upscale by) 。

Content generated by AI large model, please carefully verify (powered by aily)

References

Tusiart简易上手教程

定主题：你需要生成一张什么主题、什么风格、表达什么信息的图。选择基础模型Checkpoint：按照你需要的主题，找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型，比如说麦橘写实、麦橘男团、墨幽人造人等等，效果拔群。选择lora：在你想要生成的内容基础上，寻找内容重叠的lora，帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面，他们都在用什么lora。ControlNet：控制图片中一些特定的图像，可以用于控制人物姿态，或者是生成特定文字、艺术化二维码等等。也是高阶技能，后面再学不迟。局部重绘：下篇再教，这里不急。设置VAE：无脑选择前面提到的840000这个即可。Prompt提示词：用英文写你想要AI生成的内容，不用管语法也不要写长句，仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。负向提示词Negative Prompt：用英文写你想要AI避免产生的内容，也是一样不用管语法，只需单词和短语组合，中间用英文半角逗号隔开。采样算法：这玩意儿还挺复杂的，现在我一般选DPM++2M Karras比较多。当然，最稳妥的是留意checkpoint的详情页上，模型作者是否有推荐采样器，使用他们推荐的采样器会更有保障。采样次数：要根据你采样器的特征来，一般我选了DPM++2M Karras之后，采样次数在30~40之间，多了意义不大还慢，少了出图效果差。尺寸：看你喜欢，看你需求。

Liblibai简易上手教程

定主题：你需要生成一张什么主题、什么风格、表达什么信息的图。（没错我是喜欢看plmm多点）选择Checkpoint：按照你需要的主题，找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型，比如说麦橘写实、麦橘男团、墨幽人造人等等，效果拔群。选择lora：在你想要生成的内容基础上，寻找内容重叠的lora，帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面，他们都在用什么lora。设置VAE：无脑选840000那一串就行。CLIP跳过层：设成2就行。Prompt提示词：用英文写你想要AI生成的内容，不用管语法也不要写长句，仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。负向提示词Negative Prompt：用英文写你想要AI避免产生的内容，也是一样不用管语法，只需单词和短语组合，中间用英文半角逗号隔开。采样方法：这玩意儿还挺复杂的，现在一般选DPM++2M Karras比较多。当然，最稳妥的是留意checkpoint的详情页上，模型作者是否有推荐采样器，使用他们推荐的采样器会更有保障迭代步数：要根据你采样器的特征来，一般我选了DPM++2M Karras之后，迭代步数在30~40之间，多了意义不大还慢，少了出图效果差。尺寸：看你喜欢，看你需求。生成批次：默认1批。

SD新手：入门图文教程

CFG Scale（提示词相关性）图像与你的提示的匹配程度。增加这个值将导致图像更接近你的提示，但它也在一定程度上降低了图像质量。可以用更多的采样步骤来抵消。过高的CFG Scale体现为粗犷的线条和过锐化的图像。一般开到7~11。CFG Scale与采样器之间的关系：生成批次每次生成图像的组数。一次运行生成图像的数量为“批次*批次数量”。每批数量同时生成多少个图像。增加这个值可以提高性能，但也需要更多的显存。大的Batch Size需要消耗巨量显存。若没有超过12G的显存，请保持为1。尺寸指定图像的长宽。出图尺寸太宽时，图中可能会出现多个主体。1024之上的尺寸可能会出现不理想的结果，推荐使用小尺寸分辨率+高清修复（Hires fix)。种子种子决定模型在生成图片时涉及的所有随机性，它初始化了Diffusion算法起点的初始值。理论上，在应用完全相同参数（如Step、CFG、Seed、prompts）的情况下，生产的图片应当完全相同。高清修复通过勾选"Highres.fix"来启用。默认情况下，文生图在高分辨率下会生成非常混沌的图像。如果使用高清修复，会型首先按照指定的尺寸生成一张图片，然后通过放大算法将图片分辨率扩大，以实现高清大图效果。最终尺寸为（原分辨率*缩放系数Upscale by)。