Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

实现基于个人聊天记录的数字分身的最佳实践

Answer

实现基于个人聊天记录的数字分身的最佳实践包括以下方面:

  • 虚拟数字人的类型和驱动方式:
    • 虚拟数字人通过各种技术创造,具有外观、行为和思想等人类特征,呈现为虚拟形象。
    • 从驱动层面可分为中之人驱动和 AI 驱动两类。中之人驱动运用动作捕捉和面部捕捉技术实现交互,有上限且缺乏高并发和量产化能力;AI 驱动使用 AI 技术创建、驱动和生成内容,赋予感知和表达等交互能力。
  • 虚拟数字人的应用类型:
    • 服务型:如虚拟主播、助手、教师、客服和医生等,为物理世界提供服务。
    • 表演型:如虚拟偶像,用于娱乐、影视等场景。
    • 身份型:是物理世界“真人”进入虚拟世界的数字分身,在元宇宙中有广泛应用场景。
  • 相关开源项目:
    • 熊猫大侠基于 COW 框架的 ChatBot 最新版本支持多端部署、基础对话、语音识别、图片生成、丰富插件、Tool 工具和知识库等功能。可接入个人微信、微信公众号、企业微信应用,支持多种模型和个性化插件扩展,通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用。项目地址包括 Github:https://github.com/zhayujie/chatgpt-on-wechat ,Gitee:https://gitee.com/zhayujie/chatgpt-on-wechat 。
Content generated by AI large model, please carefully verify (powered by aily)

References

虚拟数字人,好看的皮囊有什么价值?

虚拟数字人是通过各种技术创造出来的,具有多种人类特征,比如外观、行为和思想,被呈现为虚拟形象。从驱动层面来说,虚拟数字人可以分为两类:中之人驱动和AI驱动。其中,中之人驱动运用动作捕捉和面部捕捉技术实现虚拟人与现实的交互;而AI驱动则使用AI技术创建、驱动和生成虚拟人的内容,从而赋予其感知和表达等交互能力。中之人驱动的数字人有其上限,缺乏高并发和量产化的能力,可以看做是真人“披着虚拟外皮”的产物。ChatGPT的出现催动了新一轮AI技术的浪潮,不少虚拟数字人厂商都在争相宣称自己的产品将会接入ChatGPT,赋予数字人智慧的大脑。只有通过AI技术让虚拟人“虚拟”得彻底,才能够释放出更高的价值。从应用层面来看,虚拟数字人可分为服务型、表演型和身份型三大类。服务型虚拟数字人,如虚拟主播、虚拟助手、虚拟教师、虚拟客服和虚拟医生等,主要为物理世界提供各种服务。典型代表有冯小殊、崔筱盼、观君等。表演型虚拟数字人,如虚拟偶像等,主要用于娱乐、影视等场景,例如虚拟偶像演唱会。典型代表有洛天依、AYAYI、柳夜熙等。身份型虚拟数字人是物理世界的“真人”进入虚拟世界的数字分身,在元宇宙中,数字分身有广泛的应用场景。本文讨论的虚拟数字人是AI驱动的,主要集中于服务型虚拟数字人。强调服务型虚拟数字人具有功能属性,隶属于业务层。文章仅探讨AI创造出的虚拟“皮囊”可以带来什么价值。

熊猫大侠:基于COW框架的ChatBot实现步骤

最新版本支持的功能如下:多端部署:可接入个人微信、微信公众号、企业微信应用基础对话:私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别:可识别语音消息,通过文字或语音回复,支持azure,baidu,google,openai等多种语音模型图片生成:支持图片生成和图生图(如照片修复),可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件:支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具:与操作系统和互联网交互,支持最新信息搜索、数学计算、天气和资讯查询、网页总结,基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库:通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用,基于LinkAI实现项目地址(Github):[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee):[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)

熊猫大侠:基于COW框架的ChatBot实现步骤

最新版本支持的功能如下:多端部署:可接入个人微信、微信公众号、企业微信应用基础对话:私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别:可识别语音消息,通过文字或语音回复,支持azure,baidu,google,openai等多种语音模型图片生成:支持图片生成和图生图(如照片修复),可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件:支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具:与操作系统和互联网交互,支持最新信息搜索、数学计算、天气和资讯查询、网页总结,基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库:通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用,基于LinkAI实现项目地址(Github):[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee):[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)

Others are asking
微信聊天记录整理助手
以下是关于微信群聊总结 AI 助手(JS and Electron ver)的详细介绍: 脚本版本运行: 会弹出二维码,使用微信扫码登录,登录成功后程序持续抓取群聊记录,保存在本地文件中,位置在 data/日期文件夹/群名.txt,不会上传到第三方。 手动运行总结程序,在每天结束时对某个群的内容进行总结,命令为:npm run summarize./data/20230823/xxx.txt 总结语音生成的配置。 项目介绍: 这是基于微信机器人的微信群聊总结助手,能自动收集群聊记录并用 AI 总结发送到指定群聊。 是较简单能实现完整功能的项目,用 JS 简单封装。 每次执行 summarize 命令会生成三个总结文件。 提示:使用本项目登录微信可能存在封号风险,请慎重使用并遵守相关平台规则。 下载与支持: 本项目由免费白嫖 GPT 的智囊 AI技术支持。 自己跑不起来但需要群聊总结的同学,可加机器人微信号:aoao_eth,把机器人拉进群里。 新版本:桌面应用: 可使用桌面版,一键监控、总结、发送,也可用脚本版手动运行监控和总结。 下载后直接打开配置 app key 即可运行监控和总结,一键总结,一键发送到群内。 如需要 windows 版本,可自己构建或者直接代码运行,代码在 app 文件夹中,欢迎构建成功的同学提供 windows 安装包。 截图展示的功能: 每日群聊监控和数据统计(界面实时更新) 一键总结,一键查看总结结果,一键发送到群聊 聊天记录实时查看,直接发送内容到群聊 随时更新的配置,可配置截取的文本长度和结尾词等 机器人状态监控,账号切换 正常运行界面,点击对话可看到实时对话和记录,同时可直接输入内容对话 微信登录界面
2025-03-12
如何用coze搭建一个总结聊天记录的功能
以下是用 Coze 搭建一个总结聊天记录功能的步骤: 1. 设计 Bot 目的:明确 Bot 的用途,例如作为一个 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,并提供高效的站内信息检索服务。 2. 了解 Coze 平台常用概念和功能:包括提示词(设定 Bot 的身份和目标)、插件(通过 API 连接集成各种平台和服务)、工作流(设计复杂的多步骤任务)、触发器(创建定时任务)、记忆库(保留对话细节,支持外部知识库)、变量(保存用户个人信息)、数据库(存储和管理结构化数据)、长期记忆(总结聊天对话内容)。 3. 进行 Bot 基础设置:根据机器人的作用,设计人设和回复逻辑,限制机器人的功能使其更专注于 AI 相关的知识回答和服务,还可以加入长期记忆功能来总结聊天对话内容以更好地响应用户消息,以及设计更加美观的 Bot 开场白。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问也可以查官方指南。
2024-11-15
搭建一个总结聊天记录的ai
以下是搭建一个总结聊天记录的 AI 的步骤: 1. 整理聊天记录为数据集: 如果导出了多个人的聊天记录,需手动将文件下的内容汇总到一起。 汇总完成后,保存汇总文件为“train.json”。 在当前文件夹下新建一个文本文档,重命名为“1.py”,用记事本打开并粘贴相应代码。注意标红的地方需要修改。 打开命令行窗口,输入“python 1.py”完成聊天记录整理,此步骤在后续第 31 步会用到。 2. 图文原文处理: 微信无法批量复制聊天内容,多选想要复制的聊天内容,转发到群里或文件传输助手。 收藏批量转发的聊天记录,打开收藏,点进笔记,点右上角三个点,转存为笔记,返回即可全选复制所有内容。 可使用能让电脑设备和手机设备剪切板共享的工具,避免在微信文件传输助手间折腾。 3. GPTs: 若重复做同一件事三次以上,应考虑优化步骤,可创建内容排版大师的 GPTs。 GPTs 链接:https://chat.openai.com/g/gt9dIHp4Ntneirongpaibandashi 。 该 GPTs 已加入 webpilot 的 actions,可直接将文章发给它总结内容。 4. 小卡片软件: 使用的卡片软件是小作卡片 app,官网链接:https://kosaku.imxie.club/ 。 操作步骤:打开软件,点击「自制卡片」,在「记录些什么...」中粘贴 AI 生成文本内容,点击右下角保存图标即可导出。
2024-11-15
一个用llm分析微信聊天记录的智能体案例
以下为一个用 LLM 分析微信聊天记录的智能体案例相关内容: 在当今大多数现代人工智能应用程序中,检索增强生成(RAG)是标准架构。以 Sana 的企业搜索用例为例,其过程始于应用程序加载和转换无结构文件(如 PDF、幻灯片、文本文件),跨越企业数据孤岛(如 Google Drive 和 Notion),并通过数据预处理引擎(如 Unstructured)转换为 LLM 可查询格式。这些文件被“分块”成更小的文本块,作为向量嵌入并存储在数据库(如 Pinecone)中。 当用户提出问题时,系统会检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM,然后 LLM 合成答复返回给用户。在生产中,AI 应用程序具有更复杂的流程,包含多个检索步骤和“提示链”,不同类型的任务并行执行,最终综合结果生成输出。 “智能体”(Agent)在人工智能和计算机科学领域是指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以规划、子目标分解、反思完善、记忆(包括短期记忆和长期记忆)、工具使用等关键组成部分。 在开发场景中,有上传客服聊天记录,充当智能客服的案例。此外,还有使用 GPT 的视觉功能和 TTS API 处理和讲述视频、GLM 等大模型外接数据库、开发微信小程序、开发知识库/聊天机器人搭建安全提示词 prompt 等相关案例。
2024-09-30
分析微信聊天记录的智能体
以下是关于分析微信聊天记录的智能体的相关信息: 从维度转换能力的角度来看,将各种问题、业务数据等转化为语言信息与语言模型交流能提高效率,但要注意对维度的理解,避免因语言的一维性导致交流偏差。 在业务助手中,主要有助手方式和业务环方式。助手方式是进行工作辅助,大模型负责优化、检索、启发等;业务环方式是大模型作为主业务流程中的一环,自动处理内容并生成结果。 像 Coze 这样的 Bot 智能体,可以实现多模态资讯的跨平台推送。其初衷是让用户拥有专属助手,精准筛选有价值信息。它以扣子为中心平台,通过自研插件、工作流和 API 链接微信群、企业微信群、飞书云文档多维表格等,能根据用户需求抓取热点资讯,分析处理并以多模态形式自动推送到不同平台。 在基于百川大模型的创作中,可将聊天记录的上下文转换为问答对,并对相邻信息做合并处理,还能根据需求筛选指定群或聊天对象的记录。聊天上下文窗口大小可依场景设置。
2024-09-30
直播分身怎么搭建
搭建直播分身可以参考以下步骤: 1. 构建数字人躯壳:建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。可以选择 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。另外,卡通二次元的形象接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 2. 搭建智能体:创建一个智能体,输入人设等信息,放上相关工作流。配置完成后进行测试。需要注意的是,工作流中的某些插件 api_token 填的是个人 token,不能直接发布,可将 api_token 作为工作流最开始的输入,用户自己购买后输入 api_token 再使用然后发布。 3. 直播数据分析工作流的搭建与应用: 插件测试与选择:先测试插件是否好用,如遇到数据格式不对等问题需重新选择和调整。 工作流搭建步骤:从上传直播数据,到利用大模型优化提示词和整理数据,逐步完善工作流。 工作流效果提升:增加模型和节点,不断迭代工作流,使生成的直播分析和方案质量更好。 工作流封装与应用:将工作流封装成智能体,可用于回复用户问题和处理不同的直播数据。 相关问题探讨:讨论了如获取商品评价数据的方式,以及将直播工作拆分组合的可能性等问题。 工作流运行与问题排查:涉及直播数据工作流的运行,出现问题时考虑输出环节,还提到未启动工作流的情况及解决尝试。 报名流程介绍:包括通过网址找到报名链接,填写相关信息如名字、智能体名字、商店链接、文档说明等并提交。 AI 辅助文档生成:使用豆包等 AI 工具生成提交模板,如主题、应用场景、主要功能、设计思路等内容。 加入共学小组:提到飞书中的共学小组和 prompt 学习群,满员时考虑新建或加入其他相关群组。
2025-03-09
如何制作数字分身
以下是一些制作数字分身的方法和相关信息: 可以在一些网站如 Elevenlabs.io、speechify.com、Heygen 等自助购买服务,以低成本制作自己的数字人分身。 当 Coze 接入飞书后,将自己的知识数据上传到 Coze,基于个人知识库开发 bot,并将其部署到个人订阅号上,这个 bot 可以作为数字分身与粉丝互动。 通过整合知识库,并结合提示词进行情感或行为上的描述,可以创建一个 bot,形成自己的数字分身。
2025-02-20
我想用扣子完成AI数字分身的搭建,应该怎么操作
以下是使用扣子完成 AI 数字分身搭建的步骤: 1. 登录扣子官网(https://www.coze.cn/)并注册。 2. 创建个人 Bot: 点击个人空间。 点击创建 Bot。 填入 Bot 的名字和功能介绍,以及上传或生成对应的头像。如果没想好,可以先随便填,后面可更改。 3. 在搭建生产力工具的过程中,要先深入了解自己的工作内容和需求,做出有针对性的规划。 4. 通过整合知识库,并结合提示词进行情感或行为上的描述,创建一个 Bot,形成自己的数字分身。 5. 构建整个 Flow 时要尽量减少控件使用(非必要不增加),越少的控件代表越少的逻辑,越少的逻辑代表越小的运行风险。 6. 对于复杂的批处理任务,尽量平衡批处理次数和并发,同时还要考虑模型的推理速度,不然会增大推理失败的概率。 需要注意的是,Coze 目前提供的组件,包括 bot 等工具,能满足一些基本的生产力搭建需求。虽然现阶段它还不支持循环等高级功能,但未来有望支持更多工作流的设计模式。自 Coze 推出以来,它已明确面向 C 端用户,这些用户能从中获得实质性好处。
2025-01-24
如何构建一个AI数字人分身
构建一个 AI 数字人分身主要包括以下两个方面: 一、构建数字人躯壳 数字人的躯壳建模有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢。能将喜欢的动漫人物变成数字人的躯壳。代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体。如 NextHuman、Unity,虚幻引擎 MetaHuman 等。但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 二、构建数字人灵魂 有了数字人躯壳,还需要构建数字人的灵魂,让数字人具备各种智能,比如记得个人信息,充当个人助手;在某个领域具备更专业的知识;能处理复杂的任务等等。实现这些能力有以下几个工程关键点: 1. AI Agent:要想数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过接口定义,躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的,效果可以参考 Nvidia 的 Audio2Face。 3. 实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做,比如视觉可以通过添加摄像头数据来获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。
2025-01-03
有什么AI社交产品做相亲交友服务吗?不是AI陪伴类,是AI分身促进真人交友的产品
目前在 AI 社交产品领域,有一些相关的探索和尝试。例如,某 AI 社交 APP 创始人认为,在社交场景中,核心分为陌生人社交和熟人社交。他们尝试过纯 AI 虚拟陪聊产品,但发现用户主要是年龄偏低的人群,商业价值相对较低,且可能被模型侵蚀。有效的用户留存来源于真实的人际关系,越接近熟人社交的场景,平台的用户留存能力越高。 同时,AI 赛道投资人认为,产品不应仅限于情感陪伴,应扩展为类人助手,解决理性严肃场景的问题解决和感性需求的满足。AI 社交软件的开发者认为,为用户打造数字分身、创造社交关系是有价值的,通过 AI Agent 可以在人与人之间创造新的社交关系,用户也愿意为这种新型社交互动支付相当的金额。但目前尚未有明确的专门以 AI 分身促进真人交友的成熟产品。
2024-12-03
数字分身
数字分身是指在虚拟世界中代表物理世界“真人”的存在。在不同的场景中有多种应用: 节目表演方面:如在节目单中,有“猜真人”这样的魔术互动类表演,通过数字分身增加趣味性;还有“亲情的应用场景(逝者)”,例如女儿通过逝者的数字分身再次对话。 实战课程方面:通过课程可以获得一比一数字人分身的定制体验,包括熟练使用多种热门数字人工具,掌握相关技术,了解商业应用场景及行业现状,将数字人融入工作流,还能获得进阶学习的自学路径,并且有交流群方便解决问题和交流心得。 价值探讨方面:身份型虚拟数字人在元宇宙中有广泛应用场景。服务型虚拟数字人具有功能属性,隶属于业务层,AI 创造出的虚拟“皮囊”具有一定价值。
2024-08-27
学习WaytoAGI的最佳路径是什么
学习 WaytoAGI 的最佳路径包括以下几个方面: 1. 了解最新的 AI 技术:WaytoAGI 像免费的“技术期刊”,能让您了解最新动态,还能教授实用技能,且开源免费。 2. 线上共学:通过线上共学方式,手把手教您应用 AI 技术,无论您是小白还是有一定基础,都能找到适合自己的学习路径。 3. 找到志同道合的队友:如果您想创业、做副业,或者只是想找对 AI 感兴趣的伙伴一起做事,WaytoAGI 是很好的平台。 使用 WaytoAGI 的方法: 1. 点开链接就能看:无需注册和花钱,直接点击链接:点击。 2. 想看啥就看啥:比如想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分,内容分类清晰。 3. 有问题还能问:看了还有不懂的,或者想跟别人交流,可以加入社群讨论。 此外,WaytoAGI 还有整活区,这里不是系统性学习的地方,而是一起做有趣事情的游乐场。在这里,您不用证明想法“有什么用”,可以尽情发挥对 AI 最天马行空的想象,鼓励把 AI 玩出新花样。
2025-04-10
写代码的最佳模型
写代码的最佳模型取决于具体的需求和任务。以下是一些相关要点: 1. 对于不同人使用同一个模型,结果差异大的原因在于是否懂 AI 和懂内容,专业写作通常会混合使用多个模型并取其精华,例如 Grok、Gemini、GPT 各有优势,关键在于如何运用。 2. 在需要精确计算时,可以使用代码或调用 API。GPT 自身进行算术或长计算可能不准确,此时应让模型编写并运行代码,运行代码输出结果后,再将其作为输入提供给模型进行下一步处理。同时调用外部 API 也是代码执行的一个好的用例,但执行代码时要注意安全性,需采取预防措施,特别是需要一个沙盒化的代码执行环境来限制不可信代码可能造成的危害。 3. 文本补全端点可用于各种任务,它提供了简单且强大的接口连接到任何模型。输入一些文本作为提示,模型会生成文本补全,试图匹配给定的上下文或模式。探索文本补全的最佳方式是通过 Playground,它是一个文本框,可提交提示生成完成内容。由于 API 默认是非确定性的,每次调用可能得到稍有不同的完成,将温度设置为 0 可使输出大部分确定,但仍可能有小部分变化。通过提供指令或示例可以“编程”模型,提示的成功通常取决于任务复杂性和提示质量,好的提示应提供足够信息让模型明确需求和回应方式。 需要注意的是,默认模型的训练数据截止到 2021 年,可能不了解当前事件情况。
2025-04-01
数据问答的最佳实践
以下是关于数据问答最佳实践的相关内容: Databricks: Databricks 作为大数据领域的领先服务商,在 RAG 设计上有自身特点和优势。用户输入问题后,从处理好的文本向量索引获取相关信息,结合提示词工程生成回答。上半部分 Unstructured Data pipeline 采用主流 RAG 方法,下半部分 Structured Data Pipeline 是其特征工程处理流程,也是最大特点。Databricks 从专业大数据角度出发,在准确度较高的数据存储中进行额外检索,发挥在 Real Time Data Serving 上的优势。可见其在 GenAI 时代将强大的 Lakehouse 数据处理能力与生成式 AI 技术深度融合,构建一体化解决方案。 OpenAI: 从 OpenAI Demo day 的演讲整理所得,在提升 RAG 准确率的成功案例中,OpenAI 团队从 45%的准确率开始,尝试多种方法。包括假设性文档嵌入(HyDE)和精调嵌入等,但效果不理想。通过尝试不同大小块的信息和嵌入不同内容部分,准确率提升到 65%。通过 Reranking 和对不同类别问题特别处理,进一步提升到 85%。最终,结合提示工程、查询扩展等方法,达到 98%的准确率。团队强调模型精调和 RAG 结合使用的强大潜力,仅通过简单的模型精调和提示工程就接近行业领先水平。 Loop: 具有环状结构的 RAG Flow 是 Modular RAG 的重要特点,检索和推理步骤相互影响,通常包括一个 Judge 模块控制流程,具体可分为迭代、递归和主动检索三种。 迭代检索:对于一些需要大量知识的复杂问题,可采用迭代方式进行 RAG,如 ITERRETGEN。每次迭代利用前一次迭代的模型输出作为特定上下文帮助检索更相关知识,通过预设迭代次数判断终止。 递归检索:特点是明显依赖上一步并不断深入检索,通常有判断机制作为出口,需搭配 Query Transformation,每次检索依赖新改写的 Query。典型实现如 ToC,从初始问题通过递归执行 RAC 逐步插入子节点到澄清树中,达到最大数量有效节点或最大深度时结束,然后收集所有有效节点生成全面长文本答案回答初始问题。
2025-03-17
利用agi做ppt的最佳选择
以下是一些利用 AGI 做 PPT 的较好选择: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片,还支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路来完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 此外,还了解到在众多的 PPT 工具中,AI 的介入带来了便捷与高效的体验。深入了解了五大 AI PPT 工具:MindShow、爱设计、闪击、Process ON、WPS AI,它们各自有鲜明特色和擅长场景。选择合适的工具要根据实际需求调整,试用和体验比盲目跟风更明智。 希望以上信息对您有所帮助。
2025-03-07
我需要一套帮我总结论文,阅读论文的最佳prompt
以下是为您提供的一套帮助总结和阅读论文的最佳 prompt 相关内容: 一、李继刚等的 prompt 最佳实践 对于给定的论文链接,总结如下: 1. 提出了基于 GPT3 的无代码聊天机器人设计工具 BotDesigner。 2. 创建了 Conversation 视图和 Error Browser 视图。 3. 观察了 10 名非专家提示设计师执行聊天机器人设计任务的行为,得出相关结论,如参与者能够进行机会性的提示迭代设计,但在生成、评估提示有效性和解释提示效果方面存在困难,倾向于过度推广和从人类交流角度过滤提示设计等。 二、小七姐的 Prompt 喂饭级系列教程小白学习指南(二) 1. 让 AI 帮您阅读文档时,可使用简单的 Prompt,如:于是这个提示词解决了你自己,和任何收到你 Prompt 的人微调几个关键信息就能自动让 GPT 或者 Kimi 帮你阅读一篇论文而且生成不错的总结啦! 2. 结合自己的生活或工作场景想一个能简单自动化的场景,例如自动给班级里的每个孩子起个昵称、自动排版微信群经常发的运营小文案等。 3. 选择一个好上手的提示词框架,如情境。 三、学术场景数据处理 1. 论文总结:GLM4Plus 结合良好的提示词能够帮助学生快速总结论文内容,提高论文梳理的效率。 2. 论文翻译:GLM 结合良好的提示词能够帮助学生快速翻译论文内容,提高论文阅读效率。 3. 论文内容扩写润色:精心设计的润色提示词可以根据特定场景进行调整,以便生成与特定平台风格相匹配的多样化润色结果。例如针对小红书的使用场景,调整提示词以匹配其特有的口语化、轻松愉快的氛围,将论文中的结论部分润色成适合在小红书上分享的生活化内容。
2025-03-05
编写最佳实践的工具
以下是关于编写最佳实践的工具的相关内容: 熊猫 Jay:万字解读 ChatGPT 提示词最佳实践 最佳实践 5 使用外部工具: 1. 文本嵌入工具:需要能够将文本转化为向量的工具,如 Word2Vec、BERT、FastText 等,将文本转化为高维空间中的向量。 2. 构建电影数据库:包含各种电影详细信息,可以是简单的文本文件每行包含一个电影信息,或更复杂的数据库系统。 3. 预处理和嵌入:对数据库中的每部电影信息进行文本嵌入,得到向量表示并存储。 4. 查询处理:将用户提出的查询(如“由莱昂纳多·迪卡普里奥主演的电影”)进行文本嵌入得到查询向量。 5. 向量搜索:使用快速的向量搜索算法(如余弦相似度、KNN 搜索等)在电影数据库中找到最接近的电影向量。 6. 返回结果:根据找到的最接近向量,从数据库中检索相关电影信息返回给用户。 7. 集成到 ChatGPT:将上述步骤封装成 API 或函数,在 ChatGPT 对话逻辑中调用,以便用户提出相关查询时返回相关电影信息。 小七姐:官方最佳 Prompt 实践的六个方法 策略一:编写清晰的说明 在 OpenAI 官方的说明文档中,为用户提供了若干策略以更好使用 ChatGPT。在询问中应包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”意图,所以提问时不要惜字如金,多说多提供信息能有效提高回复质量和丰富性。例如:想要大模型提供思维模型时,本能问法可能效果不佳,而提供更多信息(如为什么需要、希望列举个数、是否有已知模型参考等)能得到更符合预期的回答;请 ChatGPT 帮助记忆抽象概念时,脱口而出的问题可能不理想,提供更多细节则能得到更好的回答;了解提示词时,给出特定情景和进一步思考的问题能得到更好效果。
2025-03-03
如果是小白新手,理论应用到实践中最重要的是什么
对于小白新手,将理论应用到实践中,以下几点最为重要: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,可找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习,同时掌握提示词技巧。 4. 实践和尝试:理论学习后,实践是巩固知识的关键。尝试使用各种产品做出作品,知识库中有很多实践后的作品和文章分享,欢迎分享自己的实践成果。 5. 体验 AI 产品:与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验,激发对 AI 潜力的认识。 此外,就像有人认为“只要知道它的原理和历史,自然而然就会知道它的底线和顶点在哪里”,但实践中的体验和尝试同样不可或缺。
2025-04-13
学的理论模型如何高效指导实践,在教学中
在教学中,关于如何让学习的理论模型高效指导实践,以下是相关内容: 本系列课程是由 Deeplearning 联合谷歌 Gemini 团队开发的免费在线课程,以 Gemini 模型作为教学模型,教授如何使用多模态提示词与模型交互。但课程内容在国内存在部分无法应用的情况,且缺乏某些概念。因此,对部分教程内容进行了重新整理和刊发,并适当混合了一些入门概念,以增强普世价值。(如有需要,请访问) 在本节课程中您可以学到: 通过实践,与视频内容交互,辅助工作与学习。 通过实践,学习 Function Calling 概念与实际应用。 扩展阅读: )
2025-04-13
ai在茶饮或者餐饮行业的实践
以下是 AI 在茶饮或餐饮行业的一些实践: 中昊智达是一家智能饮茶机研发与运营服务商,专注于智能饮茶机的研发、生产和市场投放。该公司整合了茶叶种植、生产、销售和体验等多方资源,构建了完整的产业链,致力于为消费者提供便捷的茶饮服务。 有人对利用 ComfyUI 的底层原理搭建适用于中医药房自动抓药或养生茶饮茶方的工作流感兴趣。 大雍是新茶饮行业的全栈服务商,在 AI 社群的共创项目里主要负责剧本创意和分镜脚本部分。
2025-04-09
AI在人力资源中的实践应用资料
以下是关于 AI 在人力资源中的实践应用资料: 在人力资源管理领域,AI 的应用覆盖了多个环节,显著提高了工作效率。 在招聘初期,AI 可用于职位描述生成、简历分析、面试题设计等方面。 在员工绩效评估中,AI 能够分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈。 在员工培训与发展方面,AI 也能发挥作用。 相关报告推荐: 《》预测,随着技术进步,AI 将进一步推动个性化人力资源管理,创造无人值守的 HR 平台,推动企业持续发展。 此外,在全行业中,基础办公提效如 ppt、excel、会议报告、策划会、文案包装、图文海报、客服机器人 bot 等,都可以从【单个任务 task>角色 role>角色间协同 collaboration】显著提高工作效率。
2025-03-31
公司给我了一个调研作业,收集 市场上其它公司在agent业务变革上的优秀实践
很抱歉,目前没有关于市场上其他公司在 agent 业务变革方面优秀实践的相关内容。建议您通过以下途径进行收集和调研: 1. 行业报告和研究机构发布的分析:这些通常会涵盖多个公司在特定领域的实践和趋势。 2. 专业的行业论坛和社区:与同行交流,获取他们的经验和见解。 3. 公司的官方网站和公开资料:了解其业务变革的介绍和相关案例分享。 4. 新闻媒体报道:关注相关的商业新闻,获取最新的动态和实践案例。
2025-03-31
实践案例推荐,仅搜索教育、多邻国相关的内容
以下是与教育、多邻国相关的实践案例推荐: 张翼然:用 AI 为教师减负(3H) 教师的 AI 减负指南生成式人工智能在教学中的应用 教师使用 AI 小技巧 想让 AI 做好,首先你得会做 教学目标:是否明确,与课程标准和学生实际需求相符合 教学方法:是否使用多种,考虑学生不同学习风格 能力培养:是否注重培养学生的思维、创新和实践能力 教学实践 教案中的教学过程是否紧密结合学生现实生活和个人经验 群里“公开问”创造良好探究学习气氛,提问技巧可见的快速提高 是否充分利用课堂时间,让学生参与教学 是否在教学中关注学生反馈和理解,及时调整教学策略 师生关系 是否营造良好教学氛围和师生关系 是否平等尊重学生主体地位,体现尊重和关爱学生的教育理念 是否注重发挥学生积极性和主动性,激发学习热情 移动教学应用: 多邻国 六六写字 幕布 “遇见苏轼”项目式教学 在教育实践中,针对二年级学生对于抽象数学概念感到困惑的痛点问题,也有相关的探索和尝试。
2025-03-20