Navigate to WaytoAGI Wiki →
Home/All Questions
RAG构建本地知识库
RAG(Retrieval Augmented Generation,检索增强生成)是一种利用大模型能力搭建知识库的技术。其主要应用场景是当需要依靠不包含在大模型训练集中的数据时。 一个RAG的应用可以抽象为以下5个过程: 1. 文档加载:从多种不同来源加载文档,如PDF、SQL、代码等,LangChain提供了100多种不同的文档加载器。 2. 文本分割:文本分割器把Documents切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储:包括将切分好的文档块进行嵌入转换成向量的形式,以及将Embedding后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给LLM,LLM会通过问题和检索出来的提示一起来生成更加合理的答案。 简单来说,RAG就是大模型+知识库,从广泛的知识库数据中检索相关片段,然后由大模型根据这些内容生成答案。这种方式一方面可以减大模型的幻觉,提高其在特定任务上的表现,更加贴合实际应用的需求,另一方面可以明显提高搜索文档信息和生成回答的效率和体验。 LangChain是一个可以实现RAG的开源框架,它提供一些基础的组件和工具,如知识库管理、文本处理、模型加载等,允许开发人员将大语言模型(LLM)与外部数据源相结合,快速搭建自己的应用。 在实际项目中,比如此次的政府政策问答实践,由于政策的复杂性和传统智能问答产品的局限性,选择LangChainChatchat框架构建政策文档的本地知识库,实现大模型基于本地知识库内容生成回答,为用户提供政策问答和解读服务,节省查找和理解政策的时间。
2025-03-11
数据分析师常用的prompt
以下是数据分析师常用的 prompt 相关内容: 1. ChatGPT 助力数据分析: 第一个 user prompt:限定 SELECT SQL,不要用 SELECT查询全部列,仅回复一条 SELECT SQL 语句,至少查询两列(数据项、数据值),不能直接查询长类型字段(如 mediumtext/longtext),可用 count/substring 等函数查询。 system prompt 是表结构信息,如有难以理解的字段可告知 GPT 字段意义,多个表可分开描述。 需校验 GPT 生成的 SQL,不通过直接返回提示“抱歉,不支持此类请求”,通过再执行 SQL 查询数据。 数据分析的 user prompt:提示数据分析,限定返回的 JSON 格式(conclusion、keyMap、title),keyMap 用于数据 key 的映射,获取结果数据对应的维度、数据项、数据值的 key 值,用于映射数据渲染图表,根据结果数据 tableData 的维度选择对应的 prompt 传递给 GPT。 结果数据 tableData 跟随接口返回到前端,已通过 SQL 查询的数据,不能让 GPT 再次生成,否则耗时。 2. 数据:数据分析 prompt:https://notion.castordoc.com/gptprompts,castordoc 整理的适合数据团队日常使用的 prompt 案例。 3. 潘帅:手把手分享法律人如何用好 AI—Prompt 篇: 律师常用 Prompt 场景: 案例检索:最好使用法律行业垂类的 AI 产品,通用型 AI 存在问题。 Prompt 指令词示例: 请搜索近五年内关于商标侵权案件中“混淆可能性”标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。 检索近三年内所有涉及软件算法专利侵权的案例,分析法院判决中关于技术特征对比和侵权判定的标准,为即将面临的专利侵权案件提供参考。 比对不同地区法院在处理劳动争议案件时对加班费计算标准的差异判决,总结对雇主有利的判决趋势,为客户提供合规操作指导。 研究环境法相关案例,特别是涉及工业废弃物处理的法律责任,为客户提供合规处理建议,以降低潜在的法律风险。 Promopt 结构提示:【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】 类案检索:最好使用法律行业垂类的 AI 产品,通用型 AI 存在问题。
2025-03-11
文生图提示词怎么完善
完善文生图提示词可以从以下几个方面入手: 1. 明确具体的描述:使用更具体、细节的词语和短语来表达需求,避免过于笼统。 2. 添加视觉参考:在提示词中插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整整体语气和情感色彩,以生成期望的语境和情绪。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最准确表达需求的描述方式。 5. 增加约束条件:添加限制性条件,如分辨率、比例等,避免 AI 产生意外输出。 6. 分步骤构建提示词:将复杂需求拆解为逐步的子提示词,引导 AI 先生成基本结构,再逐步添加细节和完善。 7. 参考优秀案例:研究 AI 社区流行且有效的提示词范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同写法,并根据输出效果反馈持续优化完善,直至达到理想结果。 在具体的文生图提示词编写中,例如在 SD 中,括号和“:1.2”等用于增加权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时,还可以增加反向提示词,告诉 AI 不要生成的内容。 在使用 Tusiart 进行文生图时: 先确定主题,明确要生成的图的主题、风格和表达的信息。 选择基础模型 Checkpoint,找内容贴近的模型。 选择 lora,寻找内容重叠的 lora 控制图片效果及质量。 对于 ControlNet,可控制图片中特定图像,如人物姿态等。 设置 VAE,可无脑选择 840000。 编写 Prompt 提示词,用英文写需求,使用单词和短语组合,用英文半角逗号隔开。 编写负向提示词 Negative Prompt,同样用英文单词和短语组合,用英文半角逗号隔开。 选择采样算法,如 DPM++2M Karras,也可参考模型作者推荐的采样器。 确定采样次数,根据采样器特征,一般在 30 40 之间。 选择合适的尺寸,根据个人喜好和需求决定。
2025-03-11
文生图
以下是关于文生图的详细教程: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看的帖子中使用的 lora。 ControlNet:用于控制图片中的特定图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 设置 VAE:通常选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,不用管语法,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选择 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选择 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图工具和模型: 腾讯混元 luma Recraft 文生图大模型 V2.1L(美感版) 美图奇想 5.0 midjourney 快手可图 Flux.1.1 Stable Diffusion 3.5 Large Imagen 3 网页版
2025-03-11
中文的视频Ai工具
以下是一些中文的视频 AI 工具: 1. 根据视频脚本生成短视频的工具: ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频要素并生成素材和文本框架,实现从文字到画面的快速转化。 PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 Runway:AI 视频创作工具,能将文本转化为风格化视频内容。 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 2. 给视频配音效的工具: Vidnoz AI:支持 23 多种语言的配音,支持文本转语音和语音克隆功能,提供语音参数自定义和背景音乐添加工具,有经济实惠的定价方案。 Wavel Studio:支持 30 多种语言的配音,音质自然流畅,能自动去除背景噪音和杂音,提供添加字幕和文本叠加层的工具,界面友好且有多种自定义选项。 Elai.io:支持 65 多种语言的配音,音色和语调真实,能自动将唇形与语音同步,生成字幕提高视频可访问性,支持多位配音者。 Rask AI:支持 130 多种语言的配音,包括稀有和濒危语言,采用先进语音合成技术,音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 Notta:提供快速实惠的多语言配音解决方案,保留原声说话风格和细微差别,提供调整语音速度和音调的工具,支持批量处理。 Dubverse:支持 60 多种语言的配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具,与多种视频平台和社交媒体渠道整合。 Speechify:(未提及具体功能特点) 请注意,以上内容由 AI 大模型生成,请仔细甄别。这些工具各有特点,适用于不同的应用场景和需求。在选择时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。
2025-03-11
AGI是什么
AGI 即通用人工智能(Artificial General Intelligence),指的是一种能够完成任何聪明人类所能完成的智力任务的人工智能。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 GPT3 及其半步后继者 GPT3.5(在 2023 年 3 月升级为 GPT4 之前,它驱动了现在著名的 ChatGPT)在某种程度上是朝着 AGI 迈出的巨大一步,而早期的模型则不是这样。像 GPT2 这样的早期语言模型基本上自 Eliza 以来的所有聊天机器人实际上没有真正连贯回应的能力。
2025-03-11
ai提示词应该怎么提示
以下是关于如何写好 AI 提示词(prompt)的一些建议: 1. 明确任务:清晰地定义任务,比如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,在提示词中提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 5. 使用示例:如有特定期望结果,提供示例帮助 AI 理解需求。 6. 保持简洁:提示词简洁明了,避免过多信息导致 AI 困惑。 7. 使用关键词和标签:有助于 AI 理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查,根据需要调整提示词,可能需要多次迭代达到满意结果。 例如,若想利用 AI 不到 30 分钟打造爆款公众号文章,可以给 AI 这样的提示词:“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”这样的提示词不仅提供明确指导,还设定了文章基本结构和内容要求,AI 会据此生成结构完整、内容丰富、观点鲜明的文章,但最终产出的内容可能需要微调以符合预期和公众号风格。
2025-03-11
有没有以图找图的ai
以下是关于您问题的相关信息: 以图找图方面: 可以让 AI 分析文章内容,给出配图建议和关键词,然后利用这些信息在免费图库中快速找到合适的无版权图片。整个过程能提高配图效率,避免版权风险。 辅助绘制 CAD 图的 AI 工具: 1. CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 的设计软件,帮助创建复杂 CAD 模型。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,自动生成 3D 模型。 5. 主流 CAD 软件的生成设计工具:如 Autodesk 系列、SolidWorks 等,根据输入自动产生多种设计方案。 使用 AI 快速制作海报: 1. 需求场景:如发朋友圈等需要独特、高质量的图片,而网上找图可能存在质量、版权等问题。 2. 大致流程: 主题与文案:确定海报主题,借助 ChatGPT 等完成文案。 风格与布局:选择风格意向,灵活调整画面布局。 生成与筛选:使用无界 AI 生成并挑选海报底图。 配文与排版:对素材进行合理排版得到成品。
2025-03-11
DeepSeek是什么
DeepSeek 是一款爆火的产品,具有以下特点: 1. 价格亲民但实力超群,是智慧开源的领航者,在实时联网深度推理方面表现出色,被称为双冠王,用技术普惠重新定义了 AI 边界。 2. 具有便宜、开源、能联网的优势,在 Appstore 排行第一,甚至导致算力股大跌。 3. 使用地址为:https://chat.deepseek.com/(有手机客户端:扫描下面二维码) 4. 模型下载地址为:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile 5. API 文档地址未提及。 6. 提示词使用方法比较长,单独列了一篇 7. 魔改版本有:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 此外,DeepSeek 与 Deep Research 有所区别,Deep Research 是基于 GPT4o 和 o3 的产品,具备 UI 交互、搜索等功能。DeepSeek 只是品牌名称,需要加上具体模型名,如 DeepSeek V3(类似 GPT4o)或 DeepSeek R1(类似 OpenAI o1)。Deep Research 更擅长生成专业报告,而 DeepSeek Chat 虽然集成搜索,但效果仍有差距。
2025-03-11
DeepSeek是什么
DeepSeek 是一款爆火的产品,具有以下特点: 1. 价格亲民但实力超群,是智慧开源的领航者,在实时联网深度推理方面表现出色,被称为双冠王,用技术普惠重新定义了 AI 边界。 2. 具有便宜、开源、能联网的优势,在 Appstore 排行第一,甚至导致算力股大跌。 3. 使用地址为:https://chat.deepseek.com/(有手机客户端:扫描下面二维码) 4. 模型下载地址为:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile 5. API 文档地址未提及。 6. 提示词使用方法比较长,单独列了一篇 7. 魔改版本有:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 此外,DeepSeek 与 Deep Research 有所区别,Deep Research 是基于 GPT4o 和 o3 的产品,具备 UI 交互、搜索等功能。DeepSeek 只是品牌名称,需要加上具体模型名,如 DeepSeek V3(类似 GPT4o)或 DeepSeek R1(类似 OpenAI o1)。Deep Research 更擅长生成专业报告,而 DeepSeek Chat 虽然集成搜索,但效果仍有差距。
2025-03-11