利用 AI 打造专属知识库可以通过以下步骤:
此外,基于私人知识库打造个人专属的 ChatGPT 常见有两种技术方案:
☝️拆解创作任务AI创作的一个痛点在于生成的内容太过笼统模糊,也就是AI味儿很重。回想你在工作中是不是也遇到过派活后当甩手掌柜的领导,他不会告诉你步骤、方法或者技巧,只会「很急,今天就要」。如果把AI看作是一名实习生,它可能也遇到了类似的情况。所以如果想让AI成为你的得力助手,你需要提供一定的指导,比如拆解复杂的任务到合适的颗粒度,提供一些方法论让它效仿,定义好输出的格式它好按部就班地执行。我做的第一件事是拆解自己创作一期「科幻预见未来」的步骤,如下图所示:其中需要AI生成的核心内容有电影中未来世界观的描述,构成世界观的驱动力/颠覆因素的分析,和延伸思考的问题。而生成这些内容的前提是准确选出匹配电影设定的驱动力/颠覆因素,也就是流程中的第3步。因此,我们可以视其为一个关键的任务节点,而第4到第7步是围绕第3步展开的主线任务。✌️建立定向知识库由于《梦想与颠覆》卡牌是本次创作的元知识,我们可以将它导入到flowith的知识花园中作为AI可以调用的知识库。将所有的驱动力和颠覆因素转化为文字上传后,打开智能拆分模式,AI就会自动分析内容并优化拆分的逻辑,最后形成一颗颗知识「种子」。后续在画布的侧边栏激活知识库后,AI将启用知识关联功能,根据创作场景自动匹配库内素材,让输出的内容更具针对性。另外你可以选择发布或分享你的知识库,让它成为别人的知识外挂,而在flowith的知识市场中你也可以「挪用」别人的秘籍,只不过受益者是你的AI Agent。
私人知识库中内容一般有两种:日常从互联网收集的优质信息个人日常的思考以及分享如果我想基于这套知识库打造个人专属的ChatGPT该怎么做呢?这里面常见的会有两种技术方案1.训练专有大模型2.利用RAG(检索增强生成)技术初次听到这两个名词你可能有点懵,不要慌,接下来我会通俗易懂的语言让你了解他们的原理。[heading3]训练专有大模型[content]KimiChat和ChatGPT等AI聊天软件为什么能够精准的回答问题,因为他们使用了整个互联网的语料进行了训练,从而拥有了整个互联网的知识。看到这里你应该知道我想要讲什么了,对,既然能用整个互联网的知识训练出KimiChat和ChatGPT等大模型,那我能不能使用我的知识库来训练一个专有的大模型呢?当然可以!而且这样的效果是最好的。但是这并不是当下主流的方案,因为他有以下几个缺陷:高成本:训练和维护一个大型专有模型的成本非常高,需要大量的计算资源和专业知识。更新难度:如果需要更新模型的知识,需要重新训练或微调模型,这可能是一个复杂且耗时的过程下面让我们来看另一个方案:RAG(检索增强生成)
1.添加知识库:选择刚才添加的知识库内容,这里可以同时添加多个知识库2.参数设置:|配置|说明||-|-||搜索策略|选择如何从知识库中搜索内容片段,不同的检索策略适应于不同的场景。检索到的内容片段的相关性越高,大模型根据召回内容生成的回复的准确性和可用性也越高。<br><br>语义检索:像人类一样去理解词与词,句与句之间的关系。推荐在需要理解语义关联度和跨语言查询的场景使用。例如下面两组句子,第一组的语义关系就更强。<br>"狼追小羊"和"豺狼追山羊"<br>"狼追小羊"和"我爱吃炸猪排"<br>全文检索:基于关键词进行全文检索。推荐当查询内容包含以下场景时使用<br>特定名称或专有名词,术语等,例如比尔盖茨、特斯拉Model Y<br>缩写词,例如SFT<br>ID,例如,12s1w1s2系列<br>混合检索:结合全文检索和语义检索的优势,并对结果进行综合排序召回相关的内容片段。||最大召回数量|选择从检索结果中返回多少个内容片段给大模型使用。数值越大,返回的内容片段就越多。<br>||最小匹配度|根据设置的匹配度选取要返回给大模型的内容片段。低于设定匹配度的内容不会被返回。<br>该配置可过滤掉一些低相关度的搜索结果。<br><br>Tips:最大召回数量和最小匹配度直接影响输出效果,这两个值需要进行协调的多轮测试,找出最优值。|