构建知识库的方法主要有以下几种:
1. 使用 Flowith 构建:
选择“Manage Your Knowledge Base”,进入知识库管理页面。
点击左上角的加号添加新的知识库,为其起一个便于分辨的名字。
点击添加文件,建议使用 Markdown 格式的文件。
等待 Flowith 对文件进行抽取等处理,处理完毕后可在知识库管理页面测试检索。
2. 使用 Dify 构建:
准备数据:收集文本数据,进行清洗、分段等预处理。
创建数据集:在 Dify 中创建新数据集,上传准备好的文档并编写描述。
配置索引方式:根据需求选择高质量模式、经济模式或 Q&A 分段模式。
集成至应用:将数据集集成到对话型应用中,配置数据集的使用方式。
持续优化:收集用户反馈,更新知识库内容和优化索引方式。
3. 本地部署大模型并搭建个人知识库(涉及 RAG 技术):
了解 RAG 技术:大模型训练数据有截止日期,RAG 可通过检索外部数据并在生成步骤中传递给 LLM 来解决依赖新数据的问题。
RAG 应用的 5 个过程:
文档加载:从多种来源加载文档,如 PDF、SQL 等。
文本分割:把文档切分为指定大小的块。
存储:包括将文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。
检索:通过检索算法找到与输入问题相似的嵌入片。
输出:将问题和检索出的嵌入片提交给 LLM 生成答案。
文本加载器:将用户提供的文本加载到内存中以便后续处理。
2025-04-15