搭建知识库的方法如下:
来自flowith的朋友——玉树芝兰,王树义教授[heading4]构建[content]立即开始尝试构建知识库。方法是选择"Manage Your Knowledge Base",进入知识库管理页面。然后选择左上角的加号,添加新的知识库。你可以随意给知识库起个名。但是强烈建议你起个自己后来能分辨的名字,不然使用的时候会不方便找寻。下面,你就可以点击添加文件。建议使用Markdown格式的文件。一般情况平时发布的文章,存储的都是这种格式。它其实就是带标记的纯文本,比较符合大语言模型的偏好。接着,你会看到Flowith开始忙活,逐个文件进行抽取(Extraction)等处理。你根本无需操心它是怎么做的。关上页面,等处理好了再说。过了一会儿,处理完毕。我点开其中某一个文件看看。处理过后它包含3个seeds,也就是因为长度关系,切分成了3个部分。你可以在知识库管理页面测试检索。例如我这里输入「卡片」,就可以过滤出与「卡片」直接相关的发布文章内容。这就是知识库的构建方法——新建、拖拽、等待、搞定。按照类似的逻辑,王教授分别构建了「《玉树芝兰》公众号文章」和「《玉树芝兰》知识星球文章」两个知识库。知识库构建好了,咱们尝试一下问答吧。
使用Dify构建知识库的具体步骤如下:1.准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。2.创建数据集:在Dify中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。3.配置索引方式:Dify提供了三种索引方式供选择:高质量模式、经济模式和Q&A分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。4.集成至应用:将创建好的数据集集成到Dify的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。5.持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。总的来说,Dify提供了一个可视化的知识库管理工具,使得构建和维护知识库变得相对简单。关键步骤包括数据准备、数据集创建、索引配置,以及将知识库集成到应用中并持续优化。内容由AI大模型生成,请仔细甄别
本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。