Chat with Wiki - 如何建立本地大模型

Answer

建立本地大模型需要以下步骤：

硬件要求：运行大模型需要较高的机器配置，不同类型的大模型对硬件的要求不同。例如，生成文字大模型的最低配置为 8G RAM + 4G VRAM，建议配置为 16G RAM + 8G VRAM，理想配置为 32G RAM + 24G VRAM（如果要跑 GPT-3.5 差不多性能的大模型）；生成图片大模型（比如跑 SD）的最低配置为 16G RAM + 4G VRAM，建议配置为 32G RAM + 12G VRAM；生成音频大模型的最低配置为 8G VRAM +。
下载模型：SDXL 的大模型分为 base+refiner 和 VAE 模型两部分。base 是基础模型，用于文生图操作；refiner 是精炼模型，用于对文生图生成的模型进行细化；VAE 模型用于调节图片的画面效果和色彩。可以关注公众号【白马与少年】，回复【SDXL】获取下载链接。
升级 webUI 版本：将 webUI 的版本升级到 1.5 以上。
放置模型：将 base 和 refiner 放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下，将 VAE 放在“……\sd-webui-aki-v4.2\models\VAE”路径下。
启动 webUI：启动 webUI，在模型中可以看到 SDXL 的模型。
使用模型：在文生图中使用 base 模型，填写提示词和常规参数，进行生成。

需要注意的是，虽然可以在本地搭建知识库，但不一定能跑起来，因为运行大模型需要很高的机器配置，个人玩家的大多数都负担不起。

Content generated by AI large model, please carefully verify (powered by aily)

References

SDXL的大模型分为两个部分：第一部分，base+refiner是必须下载的，base是基础模型，我们使用它进行文生图的操作；refiner是精炼模型，我们使用它对文生图中生成的模型进行细化，生成细节更丰富的图片。第二部分，是SDXL还有一个配套的VAE模型，用于调节图片的画面效果和色彩。这三个模型，我已经放入了云盘链接中，大家可以关注我的公众号【白马与少年】，然后回复【SDXL】获取下载链接。想要在webUI中使用SDXL的大模型，首先我们要在秋叶启动器中将webUI的版本升级到1.5以上。接下来，将模型放入对应的文件夹中，base和refiner放在“……sd-webui-aki-v4.2modelsStable-diffusion”路径下；vae放在“……sd-webui-aki-v4.2modelsVAE”路径下。完成之后，我们启动webUI，就可以在模型中看到SDXL的模型了。我们正常的使用方法是这样的：先在文生图中使用base模型，填写提示词和常规参数，尺寸可以设置为1024*1024，进行生成。我这边使用了一个最简单的提示词“1girl”，来看看效果。生成的图片大家可以看一下，我觉得是相当不错的。

手把手教你本地部署大模型以及搭建个人知识库

1.首先访问如下网址当你打开这个页面的时候，会让你登陆，这个时候我们随便使用一个邮箱注册一个账号即可1.和本地大模型进行对话登陆成功之后，如果你已经使用过ChatGPT等类似的大模型对话网站，我相信你对这个页面并不陌生。Open WebUI一般有两种使用方式第一种是聊天对话第二种是RAG能力，也就是可以让模型根据文档内容来回答问题。这种能力就是构建知识库的基础之一如果你的要求不高的话，我们已经搭建了一个本地大模型了，并且通过Web UI实现了和大模型进行对话的功能。相信通过这么一通折腾，你就理解了ChatGPT的信息流，至于为什么ChatGPT的访问速度比我们自己的要快，而且回答效果要好，有两个原因快：是因为GPT大模型部署的服务器配置高好：是因为GPT大模型的训练参数多，数据更优以及训练算法更好如果你想要更加灵活的掌握你的知识库，请接着往下看

手把手教你本地部署大模型以及搭建个人知识库

所有人都会手把手教你部署XX大模型，听起来很诱人，因为不需要科学上网，不需要高昂的ChatGPT会员费用。但是在开启下面的教程之前，我希望你能有个概念：运行大模型需要很高的机器配置，个人玩家的大多数都负担不起所以：虽然你的本地可能可以搭建出一个知识库，但是它不一定能跑的起来下面我通过一组数据来让大家有个感性的认知。以下文字来源于视频号博主：黄益贺，非作者实操生成文字大模型最低配置：8G RAM + 4G VRAM建议配置：16G RAM + 8G VRAM理想配置：32G RAM + 24G VRAM（如果要跑GPT-3.5差不多性能的大模型）生成图片大模型（比如跑SD）最低配置：16G RAM + 4G VRAM建议配置：32G RAM + 12G VRAM生成音频大模型最低配置：8G VRAM +建议配置：24G VRAM而最低配置我就不建议了，真的非常慢，这个我已经用我自己8G的Mac电脑替你们试过了。讲这个不是泼大家冷水，而是因为我的文章目标是要做到通俗易懂，不希望通过夸大的方式来吸引你的眼球。