Chat with Wiki - 生成图片的大模型

Answer

以下是关于生成图片的大模型的相关信息：

SDXL 模型：

是 Stable Diffusion 开发公司最新发布的图像生成大模型。
以往使用的模型多在 sd1.5 官方模型上衍生微调，而 sdxl1.0 版本的官方大模型有极强升级。
- base 模型参数数量为 35 亿，refiner 模型参数数量达 66 亿。
- 由 base 基础模型和 refiner 优化模型构成，可在 base 模型基础上用优化模型绘画，更有针对性优化出图质量。
优势：
- 审美偏好有很大提升，出图效果直逼 midjourney。
- 体积和分辨率更大，base+refiner 容量达 13G，基于 1024*1024 图片训练，可直接生成 1000 分辨率以上图片，细节和绘画质量惊人。

可图大模型：

由快手可图团队开发，基于潜在扩散的大规模文本到图像生成模型。
在数十亿图文对下训练，在视觉质量、复杂语义理解、文字生成（中英文字符）等方面有巨大优势，支持中英双语，在中文特色内容理解方面更具竞争力。更多信息可查看技术报告。

SD 模型入门：

主模型后缀一般为.ckpt 或者.safetensors，体积在 2G - 7G 之间。
管理模型需进入 WebUl 目录下的 models/Stable-diffusion 目录。
在使用 WebUI 时左上角切换的就是主模型。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】向未来而生，关于SDXL你要知道事儿

首先，我们来了解一下sdxl是什么。它是Stable Diffusion的开发公司最新发布的一款图像生成的大模型，我们以往所使用的模型，绝大部分都是在sd1.5的官方模型上衍生的微调大模型。虽然sd官方的模型直接生图不怎么样，但是由各路大神微调出来的模型却是相当惊艳，这也是开源软件的厉害之处。但是这一次，sdxl1.0版本的官方大模型有了一个极强的升级，它的base模型参数数量为35亿，refiner模型参数数量则达到了66亿。可能有小伙伴会疑问，为什么sdxl的模型有两个呢？这也正是SDXL相较于SD1.5或者2.1的最大区别，SDXL是由base基础模型和refiner优化模型两个模型构成，它可以在base模型的基础上再使用优化模型进行绘画，对比之前的单模型能更有针对性的优化出图质量。而且根据官方的测试显示，sdxl1.0对比之前的sd1.5和2.1，审美偏好有了很大的提升。哪怕是只用base模型出图的效果也好了不少，甚至有直逼midjourney的趋势。我总结了一下，SDXL厉害的地方主要有以下几点：[heading2]1.更大的体积和分辨率[content]从模型的容量上就可以看出来，sd1.5的大小为4G，sd2.1的大小为5G，而SDXL的base+refiner容量有13G之多。它这么庞大的原因，主要是因为SDXL是基于1024*1024的图片进行训练的，拥有更清晰的图像和更丰富的细节。而我们知道，之前的sd1.5只有512*512的分辨率。所以，这就是为什么我们在之前输出高分辨率图片的时候会出现人物肢体混乱的情况，因为sd以为我们在同时输出多张图片。在SDXL中，我们就可以直接生成1000分辨率以上的图片，再也不用担心会出现混乱的问题，并且细节的提升使它的绘画质量也达到了惊人的地步。

延伸阅读

可图大模型是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。Kolors在数十亿图文对下进行训练，在视觉质量、复杂语义理解、文字生成（中英文字符）等方面，相比于开源/闭源模型，都展示出了巨大的优势。同时，Kolors支持中英双语，在中文特色内容理解方面更具竞争力。更多的实验结果和细节请查看我们的[技术报告](https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf)。

guahunyo：SD入门讲解PPT.pptx

OpenPose Editor3DOpenposeAdditional NetworksInpaint AnythingPhotopeaQR ToolkitSuperMergerMerge Block WeightedSettingsExtensions168/225leie uica:uaiuik.p@iervu.e0::t飞一uve))DeOldify主模型后缀一般为.ckpt或者.safetensors,并且体积比较庞大,一般在2G-7G之间。而要管理模型我们需要进入WebUl目录下的models/Stable-diffusion目录下。0.8><or:更真实-epiCRealismHelper:1(ng_deepnegative_v1_75t),(badhandv4),(worst quality:2),(low quality:2),(ormal quality:2),lowres,bad anatomy,bad haneGenerationSampling stepsTextual InversionHypernetworksCheckpointsLoraSampling methocDPM+SDE KarrasDPM++2M SDE Exponential109/150在使用WebUI时左上角切换的就是主模型了。UpscalerHires steps512x768 to 1024x1536Denoising strength01safetensorsYOUR LOGO