Chat with Wiki - 如何建立一个行业的知识库，并建立这个行业的专属AI模型？

Answer

建立一个行业的知识库并建立专属 AI 模型可以参考以下步骤：

明确行业需求和目标：确定知识库和 AI 模型要解决的具体问题和实现的功能。
收集和整理数据：包括行业相关的各种信息、文档、案例等，为知识库提供素材。
设计提示词：明确 AI 模型的角色和专注的技能，使其能够按照设定进行工作。
构建知识库：将行业特定的规则、流程、案例等内容整理成工作手册，供 AI 模型参考。
选择合适的 AI 模型：例如可以使用阿里千问模型等。
进行模型训练和优化：根据收集的数据和设定的提示词、知识库对模型进行训练，并不断优化。
融合实际场景：让人类专家配备可穿戴设备，收集现实世界的互动供 AI 学习，避免复制危险的偏见。
持续评估和改进：根据实际应用效果，对知识库和 AI 模型进行评估和改进。

例如，在医疗保健领域，开发具有潜在空间层次结构的堆叠 AI 模型，反映对每个基本元素的理解或预测能力。创建专门从事医疗保健特定领域的 AI，让其接触到顶级从业人员的多样化视角。在财经领域，依托中央财经大学的资源优势，基于内容增强型知识插槽技术构建高质量知识库，与客户自有知识库结合，实现全业务场景的支撑，可实现快速的专家级 Agent 构建与管理维护。在文档处理领域，如上海普米智图智能科技有限公司，自主研发的数据框架 Ananke 和 Agent 框架 Moros，利用智能体技术提升工作流效率。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（上篇）

大语言模型：是一个学习过无数本书、拥有无穷智慧的人。他读过无数的书、看过无数的段子，因此对公共知识、学识技能、日常聊天十分擅长。然而，在工作场景下，只会聊天侃大山可不行，你想让他帮你干活。这个时候，就需要“提示词”出场了，提示词：是你告诉这个全知全能的人，他是一个什么样的角色、他要专注于哪些技能，让他能够按照你的想法，变成一个你需要的“员工”。知识库：相当于你给这个“聪明”员工的发放了一本工作手册。即使是看过再多的书、浏览过再多的文字，也不会准确的知道见到老板娘过来吃饭要打三折，张梦飞过去吃饭要打骨折。而知识库，就是把这些内容写在了工作手册上。让这个聪明的员工，见到有人来的时候，就翻一翻手册，然后再做出反应。我的设定：AI模型：这里使用的是阿里千问模型。提示词：这里设定的角色是“美嘉”，是按照美嘉的人设、背景和对话风格做的设定。知识库：这里放的是《爱情公寓》全季的剧情，让“美嘉”拥有了自己过往的“记忆”，知道自己做过什么、好朋友是谁等等。图中右侧是一个十分简单的问答，我问：“你是谁？你和子乔在台球厅吵架那次是为了什么吵架？”她的回复是：“我是陈美嘉，那次在台球厅和吕子乔吵架是因为他约会被人撞见，我讽刺他脸大影响信号，他还反击我。后来谈到过去的事情，我指责他忘恩负义，他就说我平。最后，我伤心地说要分手，因为他之前甩过我。”

为了在医疗保健中产生真正的改变，AI 需要像我们一样学习

开发这些具有潜在空间层次结构的堆叠AI模型——复杂数据的简化地图，以帮助AI模型理解模式和关系——将反映对每个基本元素的理解或预测能力。我相信，这最初可能会平行于人类教育和教育范例，但随着时间的推移，它可能会专门发展，以在AI学习中培养新型的专业知识。这些堆叠模型可能会以与人脑皮层类似的方式发展。但是，与人类拥有视觉皮层和运动皮层不同，AI可能会拥有生物皮层和药物设计皮层——在这两种情况下，都是针对特定任务专门设计的神经架构。具有讽刺意味的是，创建专门从事诸如医疗保健这样的特定领域的AI可能比创建更接近HAL 9000的东西——具有跨领域的典型人类水平知识——更容易。实际上，我们更需要特定领域的专家AI，而不是一个能做任何普通人能做的事情的全能AI。我预计不仅会创造一个专家AI，而且会创造许多专家AI，它们在编码、数据和测试方面采用多样化的方法，以便在需要时这些模型可以提供第二个（或第三个、第四个）意见。同时，我们必须将AI从其在线基础上摘下，并将其投入到原子的世界中。我们应该让我们最熟练的人类专家配备可穿戴设备，以收集微妙的、现实世界的互动，供AI学习，就像我们即将崭露头角的学术和行业明星一样。解决健康和医学领域最复杂和不确定的问题在位元的世界中根本不存在。必须让这些专家AI接触到顶级从业人员的多样化视角，以避免复制危险的偏见。但AI的黑盒性远不如大众想象中的那么强；我们今天依赖的人类决策，正如我以前[指出的](https://www.nytimes.com/2018/01/25/opinion/artificial-intelligence-black-box.html)，可以说更加不透明。我们不能因为对传播人类偏见的恐惧而限制我们探索AI如何帮助我们民主化我们的人类专家知识的意愿，而这些专家是不幸地无法扩展的。

受邀参加了智谱 AI Z Demo Day，让我再一次相信 AGI！

依托中央财经大学的资源优势，专注于解决大模型应用的最后一公里问题，重点场景包括双碳、财金领域。核心技术：基于内容增强型知识插槽技术构建高质量知识库，与客户自有知识库结合，实现全业务场景的支撑，可实现快速的专家级Agent构建与管理维护。快速形成新领域的高质量知识库，效果超过通用大模型的能力；与业务场景深度融合，支持业务流程的AI化改造。API部署、私有化部署，价格低于同类产品50%，性能更好。Prismer.AI项目简介死文档变为活资产项目陈述上海普米智图智能科技有限公司（Prismer.AI）致力于以文档为切入点，打造智能体应用。公司自主研发的数据框架Ananke，成功成为首个将连接主义和符号主义统一融合的自动化表示框架，并建立了容纳200万篇以上文档的表示库。基于Ananke，自研了Agent框架Moros，实现了可信的数学求解、工程代码生成和算力节点调度等功能，在文档的间接信息价值与直接资产化价值之间建立了闭环。依托这两项核心技术，推出DocBrew.AI产品。该产品利用智能体技术，将算法验证、金融量化分析、数学科学计算验证和代码服务化等不同群体的工作流效率提升了一个数量级以上。艾语智能项目简介个人无抵押信贷资产处置领域是一个超级市场，每年的佣金规模超过2000亿！这个行业有超过180万的从业人员，他们长期在压抑的环境中工作。在处置过程中，他们需要与大量的借款人以及法院进行对话，同时还需要处理海量的文档生成和识别需求，从技术角度说是特别适合LLM的场景。