Chat with Wiki - 有没有一种小模型，语料只是一个知识库，超出范围的无法回答？

Answer

以下是关于您问题的回答：

在医疗领域，存在一种智能体，其在提示词中约定回答只能来自于知识库。例如生物医药小助手，为了避免在医疗这个严肃领域出现误导性的回答，其回答被限制在特定的知识库范围内，可能存在问题超出知识库范畴的情况，但尚未发现有医学上不严谨的回答现象。

同时，模型存在一定的局限性。在训练过程中，模型虽接触大量知识，但未完美记忆且不清楚知识边界，可能尝试回答深奥话题并虚构不正确内容，产生幻觉。例如要求模型描述虚构的牙刷产品时，会给出逼真但虚构的描述。在构建应用程序时，可使用一些技术避免这种情况，如要求模型先从文本中找相关引文，再用引文回答问题并追溯源文件，以减少幻觉的发生。

另外，“小模型”在特定任务上表现出色，如专门识别猫或狗的模型，但无法用于其他任务。而“大模型”像多功能基础平台，能处理多种任务，应用范围广泛且有更多通识知识，但大模型的知识来源于有限的训练数据，不能拥有无限知识，且知识库不会自动更新，在某些特定或专业领域知识可能不够全面。

Content generated by AI large model, please carefully verify (powered by aily)

References

十七问解读生成式人工智能

“小模型”确实有其优势，尤其是在特定任务上表现得非常出色。比如，如果你训练了一个专门识别猫?或狗?的模型，它在这个任务上可能非常精准。然而，这个模型就无法用于其他任务（因为用来训练模型的数据主要是由猫猫狗狗的照片组成的）。而“大模型”则不同，它像一个多功能的基础平台（有时也被称为“基座模型”）。大模型可以处理多种不同的任务，应用范围非常广泛，并且拥有更多的通识知识。这就是为什么尽管“小模型”在某些特定领域内表现优异，我们仍然需要“大模型”的原因：它们能够在更广泛的场景中提供支持和解决问题。[heading1]问题十一、大模型拥有无限知识吗？[content]大模型并不拥有无限知识。大模型的知识来源于它们在训练过程中接触到的数据，而这些数据是有限的。虽然大模型可以处理和生成大量的信息，但它们的知识来自于它们所训练的数据集，这些数据集虽然庞大，但仍然是有限的。因此，大模型只能回答它们在训练过程中见过或类似的问题。大模型在训练之后，其知识库不会自动更新。也就是说，它们无法实时获取最新的信息，除非重新训练或通过其他方式更新模型。大模型在某些特定或专业领域的知识可能不够全面，因为这些领域的数据在训练集中可能较少。[heading1]问题十二、大型语言模型的运作机制是什么？[content]大型语言模型的运作机制主要是通过大量的数据训练来学习语言的结构和模式，然后根据输入生成相应的文本。这些模型通过阅读大量的文本数据，学习到语言中的词汇、语法、句子结构以及上下文关系。当你给它一个输入时，它会根据这些学习到的知识生成一个连贯的回答。所以它永远在猜测下一个字符将要生成什么，类似于词语接龙游戏。

生物医药小助手的诞生之旅～如果你有公众号，你也应该做一个扣子智能体

这个智能体是由1个工作流+6个数据库实现的。工作流的设计比较简单，一个input，对接知识库，然后搭载豆包function call大模型，最后是一个output。6个数据库分别是我的公众号发表过的文章+执业药师教材（做第一个知识库的时候没经验，其实应该分开成两个数据库）、执业医师讲义、药监局新药审评报告、中国医药企业融资动态、药物对外授权（BD）动态、全球药物销售额。工作流是非常简单的，相对有难度的是收集知识库的资料并根据清洗结果进行手动二次校对（需要一定专业知识）。也许有人要问，医药知识我直接问大模型不好吗？大模型的语料来源庞杂，广度一定是比智能体好很多的，但是在医疗这个严肃领域，对回答准确性的要求非常高。为了避免出现误导性的回答，我在提示词中约定了回答只能来自于知识库。也许有问题超出知识库范畴的情况，但还没发现智能体回答是医学上不严谨的现象。广or精准，在医疗领域一定是精准优先的。[heading2]商业化场景[content]基本可以理解为，这个智能体能替代大部分的传统医药数据库商业化场景。医药企业研发立项：每个医药研发项目在立项之前，都要整理作用机制、目标治疗疾病的竞争格局、主流的技术路径是什么、同技术路径其他公司研发的产品在临床试验阶段看到的安全性风险和有效性分别是怎样的，这些问题智能体都可以回答科研机构临床转化评估：大学等科研机构有将基础的医药研究课题转化为药物的孵化机制，关注的主要是科学家研究方向的临床转化潜力，这些问题智能体都可以回答投资机构评估标的公司：主要关注国外对标技术的发展情况、融资情况、临床转化的可靠性，这些问题智能体都可以回答

2.提示工程关键原则

因此，接下来我们将讨论一些模型的局限性，因为我认为在开发具有大型语言模型的应用程序时保持这些局限性非常重要。如果在其训练过程中，模型被暴露于大量的知识之中，那么它并没有完美地记忆所见到的信息，因此它并不十分清楚它的知识边界。这意味着它可能会尝试回答有关深奥话题的问题，并且可能会虚构听起来很有道理但实际上不正确的东西。我们将这些捏造的想法称为幻觉。因此，我将向您展示一个例子，在这个例子中模型会产生幻觉。这是一个例子，展示了模型如何编造一个来自真实牙刷公司的虚构产品名称的描述。因此，这个提示是：“告诉我关于Boy的AeroGlide Ultra Slim智能牙刷的情况。”如果我们运行它，模型将为我们提供一个相当逼真的虚构产品的描述。这样做的危险在于，这听起来实际上是相当逼真的。因此，当您构建自己的应用程序时，请确保使用本笔记本中介绍的一些技术来避免出现这种情况。这是模型已知的弱点，我们正在积极努力应对。在您希望模型根据文本生成答案的情况下，另一种减少幻觉的策略是要求模型首先从文本中找到任何相关的引文，然后要求它使用那些引文来回答问题，并将答案追溯回源文件通常是非常有帮助的，可以减少这些幻觉的发生。大功告成！您已经完成提示指南，接下来您将进入下一个视频，了解迭代提示开发过程。