Navigate to WaytoAGI Wiki →
Home/All Questions
要用什麼搭建自己的知識庫
要搭建自己的知识库,可以考虑以下几种方式: 1. 基于 GPT API 搭建:涉及给 GPT 输入定制化的知识,但 GPT3.5 免费版一次交互的容量有限。为处理大量知识,OpenAI 提供了 embedding API 解决方案。embeddings 是浮点数字的向量,向量间距离衡量关联性,小距离表示高关联度。 2. 利用飞书搭建:个人可搭建某一领域知识库,如 AI 知识库;企业可搭建产品资料知识库。两篇相关文档及配套直播分享可供参考: 。传统知识库使用存在分类不合理导致难以查找、答案可能在文章某段落需重新阅读等痛点。 3. 本地部署大模型搭建:利用大模型搭建知识库是 RAG 技术的应用。RAG 是在大模型训练数据截止后,通过检索外部数据并在生成步骤中传递给 LLM 来实现。RAG 应用包括文档加载、文本分割、存储(嵌入和向量数据存储到向量数据库)、检索、输出等 5 个过程。文本加载器用于将用户提供的文本加载到内存以便后续处理。
2025-04-08
我是一名AI古诗词视频创作者,我想教大家如果用AI软件将古诗词的内容用视频形式表现出来,请帮我写一个教学文档,要求内容丰富,从简单到复杂,从入门到深层思考和学习,包括提示词怎么写,提示词模板,提示词举例等
以下是一份关于如何用 AI 软件将古诗词内容以视频形式表现出来的教学文档: 一、简单入门 如果是简单的图,找原图直接写提示词即可。 二、复杂图片处理 1. 图片分模块 对于复杂部分的图,把长图分多个模块。例如,将一张图分成 4 个模块。 2. 抠出背景图 智能抠图。用工具把要动的内容去除掉,用 AI 生成图片部分。如果有水印,可以把图片向下拓展一部分,然后截掉。 3. 绿幕处理前景图 将要拿来动起来的部分抠出,放在绿幕背景里或者画的背景颜色,导出图片。 4. 前景图动态生成视频 用 AI 视频生成工具写入提示词让图片动起来。有很多工具可供选择,如即梦、海螺、混元等。不停尝试抽卡即可。 5. 生成视频去掉背景 用剪映把抽卡合格的视频放在去掉内容的背景图片上,视频的背景用色度抠图调整去掉。多个视频放在背景图片,一起动即可。 三、提示词相关 1. 文案生成 工具:DeepSeek 操作:打开 DeepSeek 网站(https://chat.deepseek.com/ ),输入提示词。例如:“让 XX 用现代口语化的表达、生气骂人的口吻吐槽 XXXX(例如:吐槽现代人),XXX 目的(例如:推广 XXX 吸引游客来旅游),输出 3 条 60 字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’”可以根据自己的内容自行调整文案和字数要求。点击生成,等待 DeepSeek 输出 3 条文案。从中挑选最满意的一条(或多条)保存备用。 2. 准备人物形象图 工具:即梦 AI 操作:打开即梦 AI 网站(https://jimeng.jianying.com/aitool/image/generate ),输入提示词,即梦已经接入了 DeepSeek,可以直接用它来生成绘图提示词。调整生成参数(如风格、细节等),点击生成。预览生成的人物图,不满意可调整提示词重新生成,直到满意为止。下载最终的人物形象图。 四、其他注意事项 1. 指定视觉细节 包括颜色、照明、相机角度和风格等任何视觉元素的描述。提供的细节越多,输出就越接近您的愿景。 2. 提及所需长度和格式 如果您对特定的长度(以秒或分钟为单位)或格式(宽高比、分辨率)有想法,请提及。这对于 AI 生成符合您要求的内容至关重要。 3. 概述音频偏好 如果您的视频需要特定的音频元素,如背景音乐、旁白或音效,请详细描述。指定您是希望 AI 生成这些元素还是您自己提供。 4. 考虑道德和版权准则 确保您的提示符合道德标准和版权法。避免请求侵犯版权或涉及没有适当背景的敏感主题的内容。 请根据您的具体需求和所使用的视频 AI 工具的能力调整模板和示例。记住,输出的质量在很大程度上取决于您通过提示传达愿景的效果。
2025-04-08
有哪些支持超长上下文的大模型
以下是一些支持超长上下文的大模型: Scout:支持 1000 万上下文,适合处理超长文本和复杂推理任务。 Maverick:具有 100 万上下文,长记忆优势适配多场景替代 RAG。 Behemoth:2 万亿参数级别的大模型在训,已超越 GPT4.5 在 STEM 表现。 Claude2100k 模型的上下文上限是 100k Tokens,即 100000 个 token。 ChatGPT16k 模型的上下文上限是 16k Tokens,即 16000 个 token。 ChatGPT432k 模型的上下文上限是 32k Tokens,即 32000 个 token。 需要注意的是,token 限制同时对一次性输入和一次对话的总体上下文长度生效。例如,一次性输入不能超过规定的 token 数量,而且随着对话的进行,当达到上限时,会遗忘最前面的对话内容。
2025-04-08
从数据产品经理转行ai产品经理,需要补充哪些知识
从数据产品经理转行 AI 产品经理,您需要补充以下知识: 1. 思维链:谷歌在 2022 年的一篇论文提到,思维链能显著提升大语言模型在复杂推理方面的能力(即有推理步骤),即使不用小样本提示,也可在问题后面加一句“请你分步骤思考”。 2. RAG(检索增强生成):外部知识库切分成段落后转成向量,存在向量数据库。用户提问并查找到向量数据库后,段落信息会和原本的问题一块传给 AI,可搭建企业知识库和个人知识库。 3. PAL(程序辅助语言模型):2022 年一篇论文中提出,对于语言模型的计算问题,不让 AI 直接生成计算结果,而是借助如 Python 解释器等工具作为计算工具。 4. ReAct:2022 年一篇《React:在语言模型中协同推理与行动》的论文提出了 ReAct 框架,即 reason 与 action 结合,核心在于让模型动态推理并采取行动与外界环境互动。比如用搜索引擎对关键字进行搜索,观察行动得到的结果。可借助 LangChain 等框架简化构建流程。 个人总结:很多大佬表示要关注或直接阅读技术论文,像产品经理转型 AI 产品经理,需要懂技术脉络。但小白直接看技术论文有难度,虽可让 AI 辅助阅读,仍要完成一定知识储备。林粒粒呀的这期视频是很好的科普入门,值得一看。 此外,视频二提到了技术框架与关于未来的想象,比如 Transformer 是仿生算法的阶段性实现,10 年、20 年后可能不再使用。
2025-04-08
飞书智能伙伴创建平台 RAG实现
飞书智能伙伴创建平台(英文名:Aily)是飞书团队旗下的企业级 AI 应用开发平台,能提供简单、安全且高效的环境,帮助企业构建和发布 AI 应用,推动业务创新和效率提升,为企业探索大语言模型应用新篇章、迎接智能化未来提供理想选择。 在飞书智能伙伴创建平台上实现 RAG 相关应用有多种方式: 1. 利用飞书的知识库智能问答技术,引入 RAG 技术,通过机器人帮助用户快速检索内容。 2. 可以使用飞书的智能伙伴功能搭建 FAQ 机器人,了解智能助理的原理和使用方法。 3. 本地部署资讯问答机器人,如通过 Langchain + Ollama + RSSHub 实现 RAG,包括导入依赖库、从订阅源获取内容、为文档内容生成向量等步骤。例如使用 feedparse 解析 RSS 订阅源,ollama 跑大模型(使用前需确保服务开启并下载好模型),使用文本向量模型 bgem3(如从 https://huggingface.co/BAAI/bgem3 下载,假设放置在某个路径 /path/to/bgem3,通过函数利用 FAISS 创建高效向量存储)。 使用飞书智能伙伴创建平台的方式: 1. 在 WaytoAGI 飞书知识库首页找到加入飞书群的链接(二维码会定期更新,需在找到最新二维码),点击加入,直接@机器人。 2. 在 WaytoAGI.com 的网站首页,直接输入问题即可得到回答。 创建问答机器人的原因: 1. 知识库内容庞大,新用户难以快速找到所需内容。 2. 传统搜索基于关键词及相关性,存在局限性。 3. 需要用更先进的 RAG 技术解决问题。 4. 在群中提供快速检索信息的方式,使用更便捷。 2024 年 2 月 22 日的会议介绍了 WaytoAGI 社区的成立愿景和目标,以及其在飞书平台上的知识库和社区情况,讨论了相关技术和应用场景,并介绍了企业级 agent 方面的实践。
2025-04-08
工作流 和 智能体的区别?
工作流和智能体的区别主要体现在以下几个方面: 定义: 工作流是通过预定义代码路径来编排 LLM 和工具的系统。 智能体则是由 LLM 动态指导自身流程和工具使用的系统,能够自主控制任务完成方式。 功能: 智能体是一个自动化的“助手”,用来执行特定任务,擅长做一些具体的、重复性的任务,比如客服聊天、推荐商品、处理订单等,但只能按照预先设定的规则和任务来做事,如果遇到超出范围的情况,就不知道怎么办了。 工作流是一系列任务的流程,决定了每个步骤应该做什么,可以处理一个完整的过程,比如从客户下单、付款到发货和售后服务,涵盖了所有步骤和环节,更灵活,能够适应变化,可以调整步骤和规则来应对不同的情况,不需要一开始就固定下来。 范围: 智能体是特定任务的“助手”,用于局部执行任务。 工作流是一个“计划”或“路线图”,指导整个任务的流程。简单说,工作流是全局的,智能体是局部的。 在业务中,通常需要的是工作流而非单个智能体,因为整个业务流程设计至关重要。例如,在烹饪中,关键不在于使用多贵的锅,而是按步骤完成每道工序。因此,工作流才是解决问题的关键,它帮助优化思路、提升效率。设计好工作流才能大幅提升整体业务效率。
2025-04-08
通过ai能赚什么钱
通过 AI 赚钱的方式有很多种,以下为您详细介绍: 1. 应用开发:比如开发 Agent 应用,对外提供接口。熟悉业务并结合 AI 能力打磨产品,形成护城河。 2. 知识输出:包括 Key 商、写书、卖课等。 3. 承接项目:为有需求的客户提供相关服务。 4. 搭建镜像站。 5. 在 AI 相关岗位工作:如成为数据科学家、机器学习工程师等,获得高薪收入。 6. 利用 MCP 变现: 开发者可以构建全新的商业服务。 普通人能够借助 AI 完成复杂工作并获得收益。 企业可以构建 AI 工具矩阵,替代传统 SaaS 服务。 参与 MCP 生态中的各个环节,如作为内容创作者、工具开发者提供付费内容、数据订阅;作为开发者、系统集成者开发连接器,按调用计费或售卖;作为平台方、模型方按 token 收费;作为产品方、私域运营者收订阅费、卖课程、做服务;作为创业者、聚合平台通过抽成或广告分成。 需要注意的是,虽然学了 AI 有可能赚钱,但不一定保证每个人都能赚到钱。是否能赚钱还取决于很多因素,比如个人的学习能力、实际应用能力、对市场和商业的理解等等。仅仅学会一些基础知识可能还不足以在竞争激烈的市场中脱颖而出,需要持续学习和实践。
2025-04-08
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 生成数字人视频的方法:在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,需用另一个工具进行换脸。
2025-04-08
提示词优化工具
以下是关于提示词优化工具的相关信息: /shorten 命令: 分析提示:最短的提示,Option 5:tower of donuts, sprinkles 产生了最接近原始目标的图像。 分析结果:许多填充词,如“异想天开”“令人着迷”和“杰作”可以省略。了解“塔”和“魔法”被认为是重要的标记有助于解释为什么一些图像是用童话城堡元素生成的。了解这一点提供了一条线索:如果目标是制作一堆美味的甜甜圈,则应该从提示中删除“神奇”。 特点:该/shorten 命令是一个工具,可帮助您探索 Midjourney Bot 如何解释标记并尝试单词,但它可能不适用于所有主题和提示风格。 星流一站式 AI 设计工具: 下方 prompt 输入框: 可以输入提示词、使用图生图功能辅助创作。 提示词相关: 什么是提示词:用于描绘画面,支持中英文输入。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(一个长头发的金发女孩),基础模型 1.5 使用单个词组(女孩、金发、长头发)。 如何写好提示词: 提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词,点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,更优先。对已有的提示词权重进行编辑。 辅助功能: 翻译功能:一键将提示词翻译成英文。 删除所有提示词:清空提示词框。 会员加速:加速图像生图速度,提升效率。 提示词优化:启用提示词优化后,帮您扩展提示词,更生动地描述画面内容。 预设词组:小白用户可以点击提示词上方官方预设词组,进行生图。
2025-04-08
自动规划的prompt如何设计编写
自动规划的 prompt 设计编写可以参考以下要点: 对于简单任务场景: 设定人物:描述 Bot 所扮演的角色或职责、回复风格。 描述功能和工作流程:明确 Bot 的功能和工作流程,约定在不同场景下的回答方式,可通过自然语言强调调用工具以提升约束力,也可为 Bot 提供回复格式示例。 指示 Bot 在指定范围内回答:明确告知回答与不回答的内容。 对于复杂任务场景:推荐使用结构化格式编写提示,使用 Markdown 语法,增强可读性和对 Bot 的约束力。扣子支持将 Bot 的提示自动优化成结构化内容,您可直接使用或修改。 此外,PromptAgent 是一种将提示词优化视为策略性规划问题的方法,采用基于蒙特卡洛树搜索的规划算法,策略性地导航专家级提示词空间。它通过反思模型错误并生成建设性反馈,诱导出精确的专家级见解和深入指令,能高效制定专家级、详细且富有领域洞察力的提示词。 同时,当您理解 chatGPT 如何理解人类语言和文明后,有助于解决 prompt 编写中遇到的问题。比如,找到真正的需求来开始第一个 prompt 编写,这需要一定的洞察能力,可采用“如果某事重复做了三遍,就要思考如何将它自动化”的方法论。例如,若多次在群里发同样的自我介绍,可编写自动优化排版的 Prompt。
2025-04-08