Chat with Wiki - 本地部署deep seek后如何搭建个人知识库，详细说明一下每个步骤

Answer

以下是本地部署 Deep Seek 后搭建个人知识库的详细步骤：

在 RAGFlow 中配置 Deep Seek 模型
- 返回 RAGFlow ，打开右上角设置，进入模型提供商界面。
- 配置本地部署的 Deep Seek 模型，选择 Ollama ，并根据运行的模型配置相关信息。
- 设置基础 URL 。
- 点击确定。
导入嵌入模型
- 导入一个用于文本向量化的嵌入模型。
设置系统模型设置
创建知识库
- 返回知识库，进入数据集，导入文件或设置文件夹当作知识库。
文件解析
- 对导入的文件进行解析，解析速度取决于本机 GPU 性能（显卡性能），越好的显卡解析越快。
检索测试
- 解析完成后，进行检索测试。
进入聊天界面
- 测试没问题后，可进入聊天界面，助理设置可自行进行。

此外，如果想要对知识库进行更灵活的掌控，可以使用 AnythingLLM 软件，步骤如下：

安装 AnythingLLM ，安装地址：https://useanything.com/download 。
安装完成后进入配置页面，主要分为三步：
- 选择大模型。
- 选择文本嵌入模型。
- 选择向量数据库。
构建本地知识库
- 在 AnythingLLM 中创建独有的 Workspace 与其他项目数据隔离。
- 上传文档并在工作空间中进行文本嵌入。
- 选择对话模式，包括 Chat 模式（大模型根据训练数据和上传的文档数据综合给出答案）和 Query 模式（大模型仅依靠文档中的数据给出答案）。
测试对话
- 完成上述配置后，即可与大模型进行对话。

在进行本地知识库搭建实操之前，还需要对 RAG 有大概的了解： RAG 是一种检索增强生成技术，应用过程包括文档加载、文本分割、存储（包括将文档块嵌入转换成向量形式并存储到向量数据库）、检索、输出（把问题以及检索出来的嵌入片一起提交给 LLM 生成答案）。文本加载器用于将用户提供的文本加载到内存中以便后续处理。

Content generated by AI large model, please carefully verify (powered by aily)

References

栋人佳Dougle整理：Git使用

我们返回RAGFlow中，打开右上角设置，进入模型提供商，显示如下界面接着我们就开始配置我们本地部署的DeepSeek模型选择Ollama，配置如下信息，模型是什么取决你运行的模型是什么基础URL如下配置设置完成之后，点击确定即可，然后显示如下界面那么再导入一个embedding模型，这个嵌入模型可以用于文本的向量化导入成功之后，界面如下接着我们设置系统模型设置设置好后，就可以返回知识库，进行创建知识库了进入数据集，导入文件即可，当然可以设置文件夹当作知识库，大家自行设置导入完毕之后，需要将文件进行解析之后，大模型才会懂得文件内容是什么。可以批量进行解析，文件解析速度按照你本机的GPU性能，即显卡的性能，越好的显卡，解析越快，越差则反之解析好之后，进入检索测试即可测试没有问题，那么对于文件来说，模型是可以进行检索的，下一步就可以进入聊天界面了助理设置可以自行进行设置

手把手教你本地部署大模型以及搭建个人知识库

如果想要对知识库进行更加灵活的掌控，我们需要一个额外的软件：AnythingLLM。这个软件包含了所有Open WebUI的能力，并且额外支持了以下能力选择文本嵌入模型选择向量数据库[heading2]AnythingLLM安装和配置[content]安装地址：https://useanything.com/download当我们安装完成之后，会进入到其配置页面，这里面主要分为三步1.第一步：选择大模型1.第二步：选择文本嵌入模型1.第三步：选择向量数据库[heading2]构建本地知识库[content]AnythingLLM中有一个Workspace的概念，我们可以创建自己独有的Workspace跟其他的项目数据进行隔离。1.首先创建一个工作空间1.上传文档并且在工作空间中进行文本嵌入1.选择对话模式AnythingLLM提供了两种对话模式：Chat模式：大模型会根据自己的训练数据和我们上传的文档数据综合给出答案Query模式：大模型仅仅会依靠文档中的数据给出答案1.测试对话当上述配置完成之后，我们就可以跟大模型进行对话了[heading1]六、写在最后[content]我非常推崇的一句话送给大家：看十遍不如实操一遍，实操十遍不如分享一遍如果你也对AI Agent技术感兴趣，可以联系我或者加我的免费知识星球（备注AGI知识库）

手把手教你本地部署大模型以及搭建个人知识库

因为利用大模型的能力搭建知识库本身就是一个RAG技术的应用。所以在进行本地知识库的搭建实操之前，我们需要先对RAG有一个大概的了解。以下内容会有些干，我会尽量用通俗易懂的描述进行讲解。我们都知道大模型的训练数据是有截止日期的，那当我们需要依靠不包含在大模型训练集中的数据时，我们该怎么做呢？实现这一点的主要方法就是通过检索增强生成RAG（Retrieval Augmented Generation）。在这个过程中，首先检索外部数据，然后在生成步骤中将这些数据传递给LLM。我们可以将一个RAG的应用抽象为下图的5个过程：文档加载（Document Loading）：从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器，包括PDF在内的非结构化的数据、SQL在内的结构化的数据，以及Python、Java之类的代码等文本分割（Splitting）：文本分割器把Documents切分为指定大小的块，我把它们称为“文档块”或者“文档片”存储（Storage）：存储涉及到两个环节，分别是：将切分好的文档块进行嵌入（Embedding）转换成向量的形式将Embedding后的向量数据存储到向量数据库检索（Retrieval）：一旦数据进入向量数据库，我们仍然需要将数据检索出来，我们会通过某种检索算法找到与输入问题相似的嵌入片Output（输出）：把问题以及检索出来的嵌入片一起提交给LLM，LLM会通过问题和检索出来的提示一起来生成更加合理的答案[heading2]文本加载器（Document Loaders）[content]文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理