Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

图的角色 用 cref 去控制一致性 风格可以用 sref 去控制

Answer

在 Midjourney 中,cref 和 sref 是用于引用图片的功能,它们有以下区别和使用方法:

  1. 角色参考(cref):
    • 作用:保持图像角色的一致性。
    • 使用方法:在提示后添加“--cref”,紧接着指向人物参考图像的 URL。例如:/imagine prompt beautiful girl--cref[url]。可以使用“--cw”调整参考图像对生成图像的影响程度,数值范围从 0 到 100。强度 100(“--cw 100”)是默认值,会使用面部、头发和衣服,cw 为 0 的话仅保证脸部一致。基础格式为“--cref 图片链接,--cw 100”。
    • 参考链接:Midjourney 角色一致性功能使用报告Midjourney cref 人物一致性
  2. 风格参考(sref):
    • 作用:生成类似风格的图片,保持画风的一致性。
    • 使用方法:在提示后添加“--sref”,紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girl--sref[url]。可以使用“--sw”调整参考风格对生成图像的影响程度,数值范围从 0 到 1000。基础格式为“--sref 图片链接,--sw 100”。
    • 参考链接:五花肉:Midjourney V6 风格参考命令“--sref”更新样式参考算法“--sv 1234”

如果想引用一张图,但只是把它作为新图的一部分,可以使用“--sref”或“--cref”,并通过调整“--sw”或“--cw”的值来控制引用图像的影响程度。例如:/imagine prompt beautiful girl--sref[url]--sw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:请问midjourney cref和sref的区别

在Midjourney中,cref和sref都是用于引用图片的功能,但它们的作用和使用方式有所不同:1.角色参考(cref):cref的功能是保持图像角色的一致性。根据你提供的现有角色图像的URL,生成与之相似的角色。使用方法是在提示后添加--cref,并紧接着指向人物参考图像的URL。例如:/imagine prompt beautiful girl--cref[url]。您可以使用--cw来调整参考图像对生成的图像的影响程度,数值范围从0到100。2.风格参考(sref):sref的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加--sref,并紧接着指向风格参考图像的URL。例如:/imagine prompt beautiful girl--sref[url]。您可以使用--sw来调整参考风格对生成的图像的影响程度,数值范围从0到1000。如果你想引用一张图,但只是把它作为新图的一部分,你可以使用--sref或--cref,并通过调整--sw或--cw的值来控制引用图像的影响程度。例如,如果你想引用一张图的风格,但只希望它占新图的一部分,你可以这样写提示:/imagine prompt beautiful girl--sref[url]--sw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格¹。希望这些信息对您有所帮助!内容由AI大模型生成,请仔细甄别

五花肉:Midjourney V6 风格参考命令"--sref "更新样式参考算法"--sv 1234"

通过对比可以看到,真实人物在有或者没有--sw参数下人物的面部发生了巨大的变化,因为本身--sref是调节风格的,角色一致需要用到--cref参数,这里不过多赘述,从风格上--sv 4和原图的发色都比较一致,人物姿势都一致。服装有变化。也就是说在真实人物方面,和原图一致下,需要用到--cref参数。--sv 3发色都发生了变化,--sv 1和--s v 2风格上都有不同的方向。继续测试对比。测试例子:An animated website hero vector illustration featuring a relaxed and happy real estate professional at their open house,totally relaxed since they know their work is being automated for them and at ease in a comfy sofa chair with their laptop comfortably placed with their leg crossed over the other.The animation should be engaging and straightforward,delivering a clear message for a landing page's hero section.Darker colors should be used more and any brighter colors should be a lighter calming green or a compatible color.They should be surrounded in a circle by vectors of components relating to the successful sale of a home they were tasked with selling.--sref https://s.mj.run/hwdPSui3nkU--sv 2--ar 16:9--stylize 50--niji 6

Jerry:MJ多张图保证构图、人物一致性实战教学

cref/cw:作用:主要作用是保证人像一致性。使用方法:使用cw需要用cref指令,cw参数范围为:0-100。强度100(`--cw 100`)是默认值,它会使用面部、头发和衣服,cw为0的话仅保证脸部一致。基础格式:--cref图片链接,--cw 100。参考链接:[Midjourney角色一致性功能使用报告](https://waytoagi.feishu.cn/wiki/ZLRlwvkhKi9ZnqkLsFlcUOUgnpb)、[Midjourney cref人物一致性](https://waytoagi.feishu.cn/wiki/GoXpweu2rinYs5kTXXRczGGhnoc)sref/sw:作用:主要作用是保证画面风格和参考图一致(例如:背景基调、画风等)。使用方法:使用sw需要用sref指令,sw参数范围为:0-1000基础格式:--sref图片链接,--sw 100。参考链接:[五花肉:Midjourney V6风格参考命令"--sref"更新样式参考算法"--sv 1234"](https://waytoagi.feishu.cn/wiki/P61uwdfpLihlzTkIvSCcppDUnMb)

Others are asking
在midjourney一个画布中放置多个角色,使用pan功能添加了新的画布,怎样把新的人物描述和新人物的--cref添加到新的画布中?
在 Midjourney 中,要在一个画布中放置多个角色并将新人物描述和 cref 添加到新画布中,您可以按照以下步骤操作: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加它们。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 另外,语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,希望对大家有所帮助,地址:https://www.yuque.com/frannnk7/f7《AIGC Design 手册》
2025-03-06
基于--cref的多个人物角色出现在一个画布中,具体该如何操作?我想要详细的步骤
基于 cref 在一个画布中放置多个人物角色的操作步骤如下: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个箭头都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加。 设置画布以描绘两个人的开场提示。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,地址:https://www.yuque.com/frannnk7/aidesign?《AIGC Design 手册》
2025-03-06
scref 使用指南
以下是关于 sref 的使用指南: 风格一致: 指南:垫图链接(可选择)+关键词+“sref” +图片链接+风格化参数+“v 6.0” 指令:url +关键词+“sref” + url +“sw” +“v 6.0” sw 风格化参数:用于控制整体的风格强度,默认为 100,数值范围为 参考多张图像风格:url 间使用空格隔开,权重代表不同参考风格的权重,如 sref url A::2 url B::3 url C::5 适用模型:V6 和 Niji V6 常见问题: 您可以在使用 Vary Region 期间使用 sref 来增强美学匹配/混合。 以下是如何在使用 Vary Region 时使用sref 图像来帮助加强风格的方法: 确保 remix 已打开。放大 点击。 保留提示中确定画布总体构图的部分。尽量保留尽可能多的部分,但不要耗尽内存。如果您的细节没有显示出来,那可能是内存问题。编辑提示以删除一些不必要的细节,以腾出空间添加新的细节。 将您的细节添加到提示中。 记得用一些详细的描述(至少 5 7 个词)描述它。 现在,您可以通过将基本图像用作 sref 来加强您的添加部分的风格(视觉美学)。右键单击放大后的图像中心,从下拉菜单中选择复制链接。将该链接添加为您的sref。 详细步骤: sref 参数允许我们使用通过 URL(地址链接)提供的现有图像或图像的大致视觉特征、美学和氛围创建新图像。 官方详细步骤地址:https://discord.com/channels/662267976984297473/1204491188539883571 请参阅以下的 1 2 3 步骤教程,以帮助您开始使用风格参考图像。 图像地址链接:whatnostop_A_textured_impasto_expressive_oil_painting_depicting_d63d1644 49b4 4831 95b1 486d05452313.png
2024-08-18
--scref 教程
以下是关于“sref”的教程: “sref”参数允许我们使用通过 URL 提供的现有图像或图像的大致视觉特征、美学和氛围创建新图像。 官方详细步骤地址:https://discord.com/channels/662267976984297473/1204491188539883571 请参阅 123 步骤教程开始使用风格参考图像。 图像地址链接:whatnostop_A_textured_impasto_expressive_oil_painting_depicting_d63d164449b4483195b1486d05452313.png 莱森的教程: Midjourney cref 海马体写真教程,10 分钟不到出写真。 得益于cref,midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。 风格复制和服装的替换,应当用提示词(prompt)和sref,默认值 100,越高越接近参考图像的风格。 例如,要复制海马体图像风格,先用/describe 指令反推海马体的提示词,再配合sref。 详细步骤: 将“sref”和 URL 添加到提示的末尾。 在这一步中,以风格参考图像的视觉风格创建新图像。使用“风格参考”图像(sref)时,Midjourney 将努力只捕捉参考图像的美学特质,而不是其语义内容。新提示本身没有美学内容有助于“sref”的执行。 示例:提示词:A young man stands at the edge of the forest cliff,looking over the ocean below.sref https://s.mj.run/9DFZsjKwkyE v 6.0 翻译:一个年轻人站在森林悬崖的边缘,俯瞰下方的海洋。sref https://s.mj.run/9DFZsjKwkyE v 6.0 然后得到:whatnostop_A_young_man_stands_at_the_edge_of_the_forest_cliff_l_82470548cc114cdcabacbab5091ba111.png
2024-08-18
关于seed值 和风格一致性cref sref的文章
关于 seed 值和风格一致性 cref sref 的文章 在 Midjourney 中,cref 和 sref 都是用于引用图片的功能,但它们的作用和使用方式有所不同。 1. 角色参考(cref): cref 的功能是保持图像角色的一致性。根据你提供的现有角色图像的 URL,生成与之相似的角色。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。例如:/imagine prompt beautiful girl cref\。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref): sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girl sref\。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果你想引用一张图,但只是把它作为新图的一部分,你可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 例如,如果你想引用一张图的风格,但只希望它占新图的一部分,你可以这样写提示:/imagine prompt beautiful girl sref\sw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格¹。 希望这些信息对您有所帮助!
2024-05-08
请问midjourney cref和sref的区别,如果我想引用一张图,但只是把它作为新图的一部分如何写prompt
在Midjourney中,`cref`和`sref`都是用于引用图片的功能,但它们的作用和使用方式有所不同: 1. 角色参考(cref):`cref`的功能是保持图像角色的一致性。根据你提供的现有角色图像的URL, 生成与之相似的角色。使用方法是在提示后添加 `cref`,并紧接着指向人物参考图像的 URL。例如:`/imagine prompt beautiful girl cref `。您可以使用 `cw` 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):`sref`的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 `sref`,并紧接着指向风格参考图像的 URL。例如:`/imagine prompt beautiful girl sref `。您可以使用 `sw` 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果你想引用一张图,但只是把它作为新图的一部分,你可以使用 `sref` 或 `cref`,并通过调整 `sw` 或 `cw` 的值来控制引用图像的影响程度。 例如,如果你想引用一张图的风格,但只希望它占新图的一部分,你可以这样写提示:`/imagine prompt beautiful girl sref sw 500`。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格¹。 希望这些信息对您有所帮助!如果您有其他问题,欢迎随时向我提问。
2024-04-21
midjorney的sref合集
Midjourney 的 sref 相关内容如下: Midjourney 加入新功能,允许混合不同的风格参考融入到混合中,最终风格的强度取决于提示中分配给每种风格的顺序。 风格参考的新功能: 混合多个sref 代码,例如:sref 123 456。 混合风格参考图像 URL 和 sref 随机代码,例如:sref 123 图片链接。 为单个代码或 URL 加权,例如:sref 123::2 456::1。 新的模型个性化混合: 混合多个模型个性化代码,例如:p ab12ad3 cd34gl。 使用相同的符号进行加权混合,例如:p ab12ad3::2 cd34gl::1。 在 Midjourney 中,sref 是用于生成类似风格图片、保持画风一致性的功能。使用方法是在提示后添加sref,并紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girlsref。可以使用sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 每个 Midjourney 提示都可以分解为关键组成部分,包括主体、背景或场景、风格、情绪或氛围、官方参数命令(如控制图像风格走向)等。例如:Prompt:A lowangle shot of an alien humanoid creature with a glowing screen on its face,looking down from the side,atmospheric lighting,and a minimalist backgroundsref 2946597935sw 88s 666v 6.1 。还可以更改模型,例如:Prompt:A lowangle shot of an alien humanoid creature with a glowing screen on its face,looking down from the side,atmospheric lighting,and a minimalist backgroundar 1:1sref 2946597935sw 88s 666niji 6 。
2025-03-02
如何获取Midjourney的Sref
在 Midjourney 中,获取 sref(风格参考)的方法如下: 1. 作用:sref 的功能是生成类似风格的图片,保持画风的一致性。 2. 使用方法:在提示后添加“sref”,并紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girl sref。您可以使用“sw”来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 例如,如果想引用一张图的风格,但只希望它占新图的一部分,可以这样写提示:/imagine prompt beautiful girl srefsw 500。 3. Midjourney V6 更新风格参考命令 2.0 “sref ”的详细步骤: 将“sref”和 URL添加到您的提示的末尾。例如:提示词:A young man stands at the edge of the forest cliff,looking over the ocean below.sref https://s.mj.run/9DFZsjKwkyE v 6.0 4. 常见问题:在使用 Vary Region 期间可以使用 sref 来增强美学匹配/混合。具体方法为: 确保 remix 已打开。放大 点击。 保留提示中确定画布总体构图的部分。尽量保留尽可能多的部分,但不要耗尽内存。如果您的细节没有显示出来,那可能是内存问题。编辑提示以删除一些不必要的细节,以腾出空间添加新的细节。 将您的细节添加到提示中。记得用一些详细的描述(至少 5 7 个词)描述它。 现在,您可以通过将基本图像用作 sref 来加强您的添加部分的风格(视觉美学)。右键单击放大后的图像中心,从下拉菜单中选择复制链接。将该链接添加为您的“sref”。
2024-08-25
自动化控制电脑
以下是关于自动化控制电脑的相关信息: Google 正在开发名为“Project Jarvis”的 AI 项目,预计年底亮相。该项目旨在实现 AI 自动化操作 Chrome 浏览器中的任务,借助升级版 Gemini 2.0。“Jarvis”作为 Chrome 扩展短暂曝光,可作为上网伴侣,帮助用户完成自动化任务,通过截图分析屏幕内容,使用 Gemini 2.0 模型决定执行操作,例如预订餐厅或下单,预计将在 Gemini 2.0 发布后上线,可能在下个月。 目前没有更多关于自动化控制电脑的其他详细内容。
2025-04-10
我想学习ai视频ai生图的相关技能,并且我不想速成,我想了解其中的底层原理以便可以更好的控制生成的内容,我应该如何学习
以下是关于学习 AI 视频和生图相关技能的一些建议: 一、基础概念 1. 模型 Checkpoint:生图必需的基础模型,任何生图操作必须选定一个才能开始。 Lora:低阶自适应模型,可视为 Checkpoint 的小插件,用于精细控制面部、材质、物品等细节。 VAE:编码器,功能类似于滤镜,可调整生图的饱和度,一般选择 840000 这个。 2. 提示词 Prompt 提示词:想要 AI 生成的内容,需要花费功夫学习,可从照抄别人开始。 负向提示词 Negative Prompt:想要 AI 避免产生的内容,同样需要学习,可从照抄开始。 3. 其他概念 ControlNet:控制图片中特定图像,如人物姿态、特定文字、艺术化二维码等,属于高阶技能,可后续学习。 ADetailer:面部修复插件,用于治愈脸部崩坏,是高阶技能。 二、参数设置 1. 迭代步数:AI 调整图片内容的次数。步数越多,调整越精密,出图效果理论上更好,但耗时越长,且并非越多越好。 2. 尺寸:图片生成的尺寸大小,需适中选择,太小生成内容有限,太大 AI 可能放飞自我。 3. 生成批次和每批数量:决定重复生成图的批次和每批次同时生成的图片数量。 4. 提示词引导系数:指图像与 prompt 的匹配程度,数字增大图像更接近提示,但过高会使图像质量下降。 5. 随机数种子:固定后可对图片进行“控制变量”操作,首次生成图时无需关注。 6. 重绘幅度:图生图时用到,幅度越大,输出图与输入图差别越大。 在学习过程中,您可以先从熟悉基础模型、提示词和常见参数设置入手,通过实践和参考他人的经验不断积累知识,逐步掌握更高级的技能和工具。
2025-03-24
基于PLC的智能仓储控制系统设计
很抱歉,目前知识库中没有关于“基于 PLC 的智能仓储控制系统设计”的相关内容。但一般来说,设计这样一个系统需要考虑以下几个方面: 1. 需求分析:明确仓储系统的功能要求、存储容量、货物类型和操作流程等。 2. PLC 选型:根据系统规模和控制要求选择合适的 PLC 型号。 3. 传感器和执行器配置:选择合适的传感器来检测货物位置、状态等信息,以及确定执行器如电机、气缸等的类型和数量。 4. 控制程序编写:使用相应的编程软件编写 PLC 控制程序,实现货物的入库、出库、存储位置管理等功能。 5. 人机界面设计:提供直观、易于操作的人机界面,方便操作人员监控和控制系统。 6. 系统调试与优化:对设计好的系统进行调试,优化控制参数,确保系统稳定可靠运行。 希望以上这些通用的思路能对您有所帮助,如果您需要更详细准确的信息,建议查阅相关的专业书籍和技术资料。
2025-03-12
如何控制图生图的形象和动作呢
要控制图生图的形象和动作,可以参考以下方法: 1. 使用 ControlNet 插件: 姿态约束类预处理器:包含了所有人物信息的预处理器,可将图片发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再次发送到图生图使用 ControlNet 中 tile 模型细化,最后使用 SD 放大插件。 自定义动作骨架:在【扩展】【加载扩展列表】中搜索【posex】安装插件,或将插件文件夹拷贝至指定目录,确保软件是最新版本并重启。重启后点击“将图片发送至 ControlNet”,可通过拖动鼠标左键旋转视角、中键缩放视角、右键拖动视角,玩坏了可点击重置镜头和动作。 2. 参考风格 reference:首先进入文生图,填写提示词生成一张图。然后将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高对图片的参考越强。可以通过添加关键词的方式来改变人物的服装、表情、动作等。 3. 利用 ControlNet 控制姿势:大模型和关键词正常填写生成想要的小姐姐照片,接着鼠标滑到最下面点击“ControlNet”,上传指定姿势的照片并点击“启用”,在“预处理器”和“模型”里选择“openpose”,点击“预览预处理结果”,最后点击生成照片。
2025-02-28
生成视频不受提示词控制怎么办
如果生成视频不受提示词控制,可以考虑以下方法: 1. 向提示添加其他描述符,以便更好地控制生成的视频内容,例如: 电影摄影术语,如浅景深、胶片拍摄和电影。 构图术语,如广角、特写、从上方拍摄和从下方拍摄。 照明术语,如背光、柔光和硬光等。 颜色分级术语,如饱和色、高对比度以及暖色调或冷色调。 情绪或语气术语,如 somber、tense、euphoric 和 mysterious。 摄像机移动术语,如向右或向左平移、向上或向下倾斜以及推拉或向外移动。 2. 对于海螺 AI: MiniMax 视频模型不仅可以准确识别用户上传的图片,并确保所生成视频在形象保持上与原输入图像高度一致,且光影、色调完美嵌入新场景的设定,为创作者提供连贯、深度创作的空间。 在指令响应方面,还能理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现“所写即所见”。 只依靠模型综合能力,就能实现最顶级的影视特效。 人物表情控制力强,5 秒钟内实现从开怀大笑到掩面哭泣,让视频表达更能深入人心。 近期,海螺 AI 视频同步上线了提示词优化功能,即使在大家对特定的构图、氛围、动作或运镜没有特殊指定要求时,建议开启此功能,聪明的海螺 AI 会结合原始 Prompt 扩展视频的美学呈现。同时,对于更专业的创作者,开放 2000 字的提示词空间,让创作更加精准。 3. 使用 Camera Motion 时: 点击“AddImage”上传图片。 在“Prompt”中输入提示词。 选择您想要的运镜方向,输入。 运动幅度和画面主体运动幅度有关,与运镜大小无关,可以设置成您想要的任意值。 选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 点击“create”,生成视频。
2025-02-18
使用O1来控制智能硬件
O1 是一个完全开源的可以控制家里电脑的 AI 语音智能助手。它能够看到您的屏幕内容,学习使用您常用的应用,无论您身在何处,都能通过按下按钮、讲话让它帮您操作电脑完成任务。其 CAD 文件、电路设计、代码完全开源,有能力的开发者可以直接制作该设备。灵感来自 Andrej Karpathy 的 LLM 操作系统,10 月份他的 LLM 科普视频含金量仍在上升。O1 运行一个代码解释语言模型,并在计算机内核发生特定事件时调用它。项目地址:https://github.com/OpenInterpreter/01
2025-02-05
人物一致性
Midjourney 的角色一致性功能: 功能介绍:类似于“风格参考”功能,尝试使人物与“人物参考”图像相匹配。 使用方法:在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。可以使用`cw`来修改参考“强度”,从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 实际效果:例如以甜茶或小公主的图片为案例,不同的强度参数下,发型、衣服等会有相应变化。 相关优势:能节省工期,提升生产管线的可控性。 其他应用:利用 MJ 重绘功能,在重绘提示词里输入`cref cw`保证角色一致性。对于生成图中的黑边,可框住黑边部分重绘输入关键词“background”去除,保证背景一致。 体验网址:MJ 的网页版体验较好,网址为 https://alpha.midjourney.com/
2025-03-29
星流ai人物一致性
以下是关于星流 AI 人物一致性的相关内容: 在实现角色一致性方面,有以下几种方法和示例: 1. 可以通过特定的 prompt 格式来实现,公式为:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。例如: 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。 2. Midjourney 推出了角色一致性功能,同步支持 MJ V6 和 Niji V6。跟之前的风格一致性sref 命名基本一致,为cref。cref 背后参数cw 的值可以从 0 设到 100,cw 100 会参考原图的脸部、头发和衣服,但相应的会非常不吃 Prompt;cw 0 时,就只会参考脸部,大概约等于一个换脸。 3. PixVerse 有“角色(Character)”新功能,能实现 AI 生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在 AI 生成视频中轻松切换场景,同时保持同一角色身份。该功能目前只支持真实人脸,暂不支持动物或其他风格照片。操作说明:在主页面点击选择“Character”,点击“Create Character”,在此界面通过点击或拖动的方式上传图片,命名您创建的 Character,最后点击“Create Cha”。提示:最好使用包含真实人脸的单人图片效果最佳,脸部大小需要超过 200×200px,面部无遮挡。Character 添加完毕后,等待 20 秒左右,在看到“Success”提示后,点击“Create”进。若未等到“Success”提示便进入创作界面,会找不到创建的 Character,此时需等待 10 30 秒,待 Character 创建完成即可。 相关网址: 1. 2. 3. Midjourney 网页版:https://alpha.midjourney.com/ 4. PixVerse:https://app.pixverse.ai/ (目前可以免费使用)
2025-03-18
人物一致性
Midjourney 的角色一致性功能: 此功能是官方推出的重要功能,可使生成的人物与参考图像相匹配。 使用方法:在提示词后输入 `cref URL` 并附上人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可使用 `cw` 来修改参考强度,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 该功能同步支持 MJ V6 和 Niji V6。 对于保证角色一致性,可利用 MJ 重绘功能,在重绘提示词里输入 `cref cw` 。 若有黑边问题,可将黑边部分框住,重绘输入关键词 `background` 去除黑边保证背景一致。 体验 MJ 网页版效果较好,网址:https://alpha.midjourney.com/
2025-03-18
comfy ui 九宫格生图保持人物一致性的原理
Comfy UI 九宫格生图保持人物一致性的原理主要基于 PuLID 技术,具体如下: PuLID 是一种用于在文本生成图像时自定义图像中人物或物体身份(ID)的新技术,它结合了两个不同的模型分支(Lightning T2I 分支和标准扩散模型),引入了两种损失(对比对齐损失和精确 ID 损失)。 Lightning T2I 分支是一个快速、高效的文本到图像生成模型。 标准扩散模型是常见的、生成高质量图像的模型。 对比对齐损失帮助模型学习将输入的文本和生成的图像内容对齐,使生成的图像更符合文本描述。 精确 ID 损失确保生成的图像中的特定身份特征(比如人物的脸部特征)与目标 ID 一致。 此外,在保持人物一致性方面,还有一些操作步骤: 生成图像(提示词加入分割描述,让一张图生成多张同空间小图)。 通过目标图像不断的重复生成,获取更多一致性的角色图像,下载分类(按照视角不同分类)。 上传图像,调用 prefer option set 命令,先写命令名称(一个视角操作一次),再放入该视角的照片(4 5 张)。 放开角色限制生成图像,在确认好的图像上进行局部重绘,框选头部,在原来的命令下加入—快捷命令名称,确认生成即可。 同时,Eva CLIP 也是相关的技术: Eva CLIP 是一种基于对比学习的视觉文本模型,将文本描述和图像内容映射到一个共享的嵌入空间。 对比学习架构:使用对比学习方法,将图像和文本嵌入到一个共享的空间,通过最大化匹配图像和文本对的相似度,同时最小化不匹配对的相似度,学习到图像和文本之间的关联。 强大的特征提取能力:编码器擅长提取图像中的细节特征,并将其转换为有意义的嵌入向量,用于下游任务。 多模态应用:能够处理图像和文本两种模态,广泛应用于多模态任务中,如生成、检索、标注等。 其应用场景包括图像生成、图像检索、图像标注等。Eva CLIP 编码器通常与深度神经网络结合使用,如卷积神经网络(CNN)用于图像特征提取,Transformer 网络用于处理文本描述。 项目地址:https://github.com/ToTheBeginning/PuLID 相关资源: instant ID 脸部特征抓取得比 pulid 好,放在最后一步重绘,先 pulid,再 instantID https://pan.baidu.com/s/1Tro9oQM85BEH7IQ8gVXKsg?pwd=cycy 工作流与模型地址:https://pan.quark.cn/s/2a4cd9bb3a6b 说明文档:https://xiaobot.net/post/6544b1e8 1d90 4373 94cf 0249d14c73c8 测试案例:
2025-03-17
comfy UI 如何保持人物一致性
要在 ComfyUI 中保持人物一致性,可以通过以下方式实现: 1. PuLID 技术: PuLID 是一种用于在文本生成图像时自定义图像中人物或物体身份(ID)的新技术,无需复杂调整。 它结合了 Lightning T2I 分支和标准扩散模型两个不同的模型分支,并引入了对比对齐损失和精确 ID 损失两种损失,以确保在保持原始模型效果的同时,高精度地自定义 ID。 Lightning T2I 分支是快速、高效的文本到图像生成模型,标准扩散模型是常见的生成高质量图像的模型。 PuLID 可以让您在生成图像时更精确地定制人物或物体的身份,将特定 ID(例如人脸)嵌入到预训练的文本到图像模型中,而不会破坏模型的原始能力。 项目地址:https://github.com/ToTheBeginning/PuLID 相关资源: 百度网盘:https://pan.baidu.com/s/1Tro9oQM85BEH7IQ8gVXKsg?pwd=cycy 工作流与模型地址:https://pan.quark.cn/s/2a4cd9bb3a6b 说明文档:https://xiaobot.net/post/6544b1e81d90437394cf0249d14c73c8 instant ID 脸部特征抓取得比 PuLID 好,可放在最后一步重绘,先 PuLID,再 instantID。 2. 节点设置: 节点插件 PuLID ComfyUI:https://github.com/cubiq/PuLID_ComfyUI model:使用预训练的基础文本到图像扩散模型,如 Stable Diffusion。 pulid:加载的 PuLID 模型权重,定义 ID 信息如何插入基础模型。 eva_clip:用于从 ID 参考图像中编码面部特征的 EvaCLIP 模型。 face_analysis:使用 InsightFace 模型识别和裁剪 ID 参考图像中的面部。 image:提供的参考图像用于插入特定 ID。 method:选择 ID 插入方法,如“fidelity”(优先保真度)、“style”(保留生成风格)和“neutral”(平衡两者)。 weight:控制 ID 插入强度,范围为 0 到 5。 start_at 和 end_at:控制在去噪步骤的哪个阶段开始和停止应用 PuLID ID 插入。 attn_mask:此选项用于提供灰度掩码图像,以控制 ID 自定义的应用位置,但并不是必需输入,而是可选输入。 Advanced Node:提供了高级节点,可以通过调整 fidelity 滑块和 projection 选项进行更精细的生成调优。比如,ortho_v2 和 fidelity:8 等价于标准节点的 fidelity 方法,而 projection ortho 和 fidelity:16 等价于 style 方法。 此外,在 8 月 13 日的 ComfyUI 共学中也提到控制人物一致性有很多方法,课程后期会介绍。
2025-03-17
人物一致性
Midjourney 的角色一致性功能: 此功能类似于“风格参考”,但尝试使人物与“人物参考”图像相匹配。 使用方法:在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 该功能同步支持 MJ V6 和 Niji V6。 对于保证角色一致性,可利用 MJ 重绘功能,在重绘提示词里输入`cref cw`。 若有黑边问题,可将黑边部分框住,重绘输入关键词“background”去除黑边,保证背景一致。 体验 MJ 网页版效果更佳,网址:https://alpha.midjourney.com/
2025-03-13