Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

将复杂任务分解为简单子任务以简化问题,这样的ai工具都有什么

Answer

以下是一些可将复杂任务分解为简单子任务以简化问题的 AI 工具和相关策略:

  1. OpenAI 官方指南中提到的策略:
    • 使用意图分类来识别与用户查询最相关的指令。
    • 对于需要很长对话的对话应用程序,总结或过滤之前的对话。
    • 分段总结长文档,并递归构建完整总结。
    • 指示模型在急于得出结论之前先自己找出解决方案。
    • 使用内心独白或一系列查询来隐藏模型的推理过程。
    • 询问模型在之前的回答中是否遗漏了什么。
    • 使用基于嵌入的搜索来实现高效的知识检索。
    • 使用代码执行来进行更准确的计算或调用外部 API。
  2. 在 AI-Agent 系列中:
    • 基于 LLM 的 AI Agent 应首先以适当的方式将复杂任务分解为子任务,然后有效地组织和协调这些子任务,这有赖于 LLM 的推理和规划能力,当然也包括对工具的理解。
Content generated by AI large model, please carefully verify (powered by aily)

References

目录:OpenAI 官方指南

正如在软件工程中将复杂系统分解为一组模块化组件是一种良好的实践,对GPT提交的任务也是如此。复杂任务的错误率往往比简单任务高。此外,复杂任务往往可以被重新定义为一系列简单任务的工作流程,其中早期任务的输出用于构造后续任务的输入。策略:使用意图分类来识别与用户查询最相关的指令对于需要很长对话的对话应用程序,总结或过滤之前的对话分段总结长文档,并递归构建完整总结[heading2]给GPT时间「思考」[content]如果要求你将17乘以28,你可能不会立即知道答案,但是还是可以花时间计算出来。同样,GPT在试图立即回答问题时会犯更多的推理错误,而不是花时间去推导出答案。在回答之前要求一个推理链条可以帮助GPT更可靠地推理出正确的答案。策略:指示模型在急于得出结论之前先自己找出解决方案使用内心独白或一系列查询来隐藏模型的推理过程询问模型在之前的回答中是否遗漏了什么[heading2]使用外部工具[content]通过将其他工具的输出提供给GPT来补偿GPT的弱点。例如,文本检索系统可以告诉GPT相关的文档。代码执行引擎可以帮助GPT进行数学运算和执行代码。如果一个任务可以由工具而不是GPT更可靠或有效地完成,那么将其转移出去,以便获得双方的最佳效果。策略:使用基于嵌入的搜索来实现高效的知识检索使用代码执行来进行更准确的计算或调用外部API

目录:OpenAI 官方指南

[title]目录:OpenAI官方指南[heading1]二、战术[heading2]策略:将复杂任务拆分为更简单的子任务[heading3]战术:使用意图分类来识别与用户查询最相关的指令对于需要大量独立指令集来处理不同情况的任务,首先对查询类型进行分类并使用该分类来确定需要哪些指令可能是有益的。这可以通过定义与处理给定类别中的任务相关的固定类别和硬编码指令来实现。这个过程也可以递归地应用于将任务分解为一系列阶段。这种方法的优点是每个查询将仅包含执行任务下一阶段所需的指令,与使用单个查询执行整个任务相比,这可以降低错误率。这也可以降低成本,因为更大的提示运行成本更高([参见定价信息](https://openai.com/pricing))。例如,假设对于客户服务应用程序,可以将查询分类如下:|系统|你将会接收到客户服务查询。将每个查询分类为主要类别和次要类别。以json格式提供你的输出,键(key)为:primary和secondary。主要类别:计费、技术支持、账户管理或一般查询。计费次要类别:-取消订阅或升级-添加付款方式-收费说明-对收费提出异议技术支持次要类别:-故障排除-设备兼容性-软件更新账户管理次要类别:-密码重置-更新个人信息-关闭帐户-账户安全一般查询二级类别:-产品信息-定价-反馈-与人交谈|<br>|-|-|<br>|用户|我需要让我的互联网重新工作。|

AI-Agent系列(一):智能体起源探究

[title]AI-Agent系列(一):智能体起源探究[heading2]十、基于LLM的AI Agent[heading3]10.3行动模块(Action)理解工具:AI Agent有效使用工具的前提是全面了解工具的应用场景和调用方法。没有这种理解,Agent使用工具的过程将变得不可信,也无法真正提高AI Agent的能力。利用LLM强大的zero-shot learning和few-shot learning能力,AI Agent可以通过描述工具功能和参数的zero-shot demonstartion或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。这些学习方法与人类通过查阅工具手册或观察他人使用工具进行学习的方法类似。在面对复杂任务时,单一工具往往是不够的。因此,AI Agent应首先以适当的方式将复杂任务分解为子任务,然后有效地组织和协调这些子任务,这有赖于LLM的推理和规划能力,当然也包括对工具的理解。使用工具:AI Agent学习使用工具的方法主要包括从demonstartion中学习和从reward中学习(清华有一篇从训练数据中学习的文章)。这包括模仿人类专家的行为,以及了解其行为的后果,并根据从环境和人类获得的反馈做出调整。环境反馈包括行动是否成功完成任务的结果反馈和捕捉行动引起的环境状态变化的中间反馈;人类反馈包括显性评价和隐性行为,如点击链接。具身智能在追求人工通用智能(AGI)的征途中,具身Agent(Embodied Agent)正成为核心的研究范式,它强调将智能系统与物理世界的紧密结合。具身Agent的设计灵感源自人类智能的发展,认为智能不仅仅是对预设数据的处理,更多地来自于与周遭环境的持续互动和反馈。与传统的深度学习模型相比,LLM-based Agent不再局限于处理纯文本信息或调用特定工具执行任务,而是能够主动地感知和理解其所在的物理环境,进而与其互动。这些Agent利用其内部丰富的知识库,进行决策并产生具体行动,以此改变环境,这一系列的行为被称为“具身行动”。

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
AI 衡量一个AI任务的指标是不是有准确率 和召回率 分别啥区别
在 AI 任务中,常见的衡量指标包括准确率和召回率。准确率(Accuracy)衡量的是模型预测正确的比例。而召回率主要用于信息检索等任务,衡量的是模型能够正确检索出相关内容的比例。 在摘要任务中,一般用 ROUGE 指标,其中 ROUGE2 是把两个 sequence 按 2gram 的方式做切分做频次统计,然后计算 pred 和 gt 之间的召回率。 对于不同的 AI 任务,还有其他多种指标,如在 NLP 中: 信息检索任务常用 NDCG@K 指标,核心衡量最相关文档是否排序足够靠前。 文本生成任务可用 BitsperByte 指标。 针对二分类任务,一般用 ECE 指标(Expected Calibration Error)来度量模型输出概率 p 时,最终正确率真的为 p 的一致性。 此外,还有一些其他方面的评估指标,如不确定性(Calibration and Uncertainty)、鲁棒性(Robustness,包括 invariance 和 equivariance)、公平性(Fairness)、偏见程度(Bias and stereotypes)、有毒性(Toxicity)等。 传统的 RAG 解决方案在检索效率和准确性上存在问题,Anthropic 通过“上下文嵌入”解决了部分问题,但 RAG 的评估仍待解决,研究人员正在探索新的方法,如 Ragnarök。 在提示词设计方面,Claude 官方手册提出“链式提示”的方法理念,将复杂任务拆解为多个步骤,具有准确率高、清晰性好、可追溯性强等好处。ChatGPT 官方手册也有类似理念,同时还有相关论文如在 ICLR 2023 上发表的提出 LeasttoMost Prompting 提示词策略的论文,在文本理解和生成场景中表现优秀。
2025-04-09
AI 自动安排批量设置工作任务的个人效率 app 推荐
目前在市场上,有一些可以实现 AI 自动安排批量设置工作任务以提升个人效率的应用程序,以下为您推荐几款: 1. Todoist:它具有强大的任务管理功能,支持设置优先级、提醒和分类,能帮助您合理规划工作任务。 2. Microsoft To Do:与微软生态系统紧密集成,方便您在不同设备上同步任务,并进行批量设置。 3. Trello:以看板的形式展示任务,直观清晰,便于批量安排和跟踪工作进度。 您可以根据自己的需求和使用习惯选择适合您的应用程序。
2025-04-07
AI 自动安排批量设置工作任务的效率工具。
以下是关于 AI 自动安排批量设置工作任务的效率工具的相关内容: 对于中小企业利用人工智能(AI)进行转型,在任务自动化方面: 首先要评估和识别日常重复性高的任务,通过分析工作流程、观察和记录员工工作,确定耗时且重复性高的活动,明确通过观察和记录要达成的具体目标,如提高效率、减少错误率等,计划和安排对员工日常工作的观察,与员工交谈了解其看法,分析收集的数据以确定可优化的任务,并制定引入新工具等具体行动计划。 最后引入自动化工具,如 RPA 技术,根据企业需求和预算选择合适工具,在 IT 系统中部署并配置,进行测试和调整优化。 适合工作流化的业务一般具备以下特点: 重复性工作多,业务中的任务或流程高度重复。 业务流程固定,步骤相对固定,且具有标准化的操作流程。 以自媒体工作者为例,常见工作流步骤包括内容策划、创作、编辑、审核、发布、互动和效果分析优化等,通过 AI 标准化这些步骤并利用工具自动执行,可提高效率,让工作者有更多时间和精力专注核心业务。 一般来说,Workflow 是一系列相互连接的步骤,旨在完成特定任务或目标。最简单的工作流是确定性的,遵循预定义步骤序列。有些工作流会利用大模型等 AI 技术,被称为 AI Workflows,可分为 Agentic 和非 Agentic 。Agentic Workflow 是由单个或几个 AI Agents 动态执行的一系列连接步骤,以实现特定任务或目标,AI Agents 被授予权限,利用其核心组件将传统工作流转变为响应式、自适应和自我进化的过程。
2025-04-07
NLP包括哪些任务,现在的GPT是否都已覆盖,CV类包括哪些任务,现在由哪些网络模型覆盖
NLP 包括的任务有文本分类、情感分析、命名实体识别、信息抽取、机器翻译、问答系统、摘要生成等。目前 GPT4 在一系列 NLP 任务上表现出色,优于现有的大型语言模型,但不能说已完全覆盖所有 NLP 任务。 CV 包括的任务有图像分类、目标检测、图像分割、图像生成、视频分析等。在 CV 领域,一些常见的网络模型有生成对抗网络(GANs)、变分自编码器(VAEs)、流模型、扩散模型、视觉变压器(ViT)、Swin 变压器等。
2025-03-16
角色:你是一名软件开发公司的运营经理 背景:现在要准备入局AI导航网站市场,通过AI导航网站实现布局产品流量入口,来获取AI风口的流量。 任务:请你完成AI导航网站的国内外市场调研 要求:调研内容包括AI网站导航的市场、竞品、用户分析以及产品规划、团队人员需求及资源需求、有哪些风险点
以下是对您需求的调研分析: 一、市场分析 目前,AI 领域发展迅速,AI 导航网站作为获取相关信息和资源的入口,具有较大的市场潜力。随着人们对 AI 技术的关注度不断提高,对于便捷、高效的 AI 资源导航需求也在增加。 二、竞品分析 暂未获取到直接关于 AI 导航网站的竞品详细信息。 三、用户分析 用户可能包括对 AI 技术感兴趣的个人、开发者、研究人员、企业等。他们希望通过导航网站快速找到所需的 AI 工具、资源、案例等。 四、产品规划 1. 提供全面、准确的 AI 网站分类和链接,涵盖工具、研究成果、应用案例等。 2. 设立用户评价和推荐系统,帮助用户筛选优质资源。 3. 提供个性化推荐功能,根据用户的浏览历史和偏好推送相关内容。 五、团队人员需求 1. 技术人员:负责网站的开发和维护,如前端开发、后端开发等。 2. 内容编辑:收集、整理和更新 AI 网站信息。 3. 运营人员:负责推广、用户互动和数据分析。 六、资源需求 1. 服务器和带宽资源,以保证网站的稳定运行和快速响应。 2. 数据采集和更新的工具和技术。 七、风险点 1. 市场竞争激烈,可能面临已有成熟竞品的压力。 2. AI 技术发展迅速,需要及时更新网站内容,以保持竞争力。 3. 可能存在版权和法律合规方面的风险。 4. 用户获取和留存的挑战,需要提供优质的服务和用户体验。
2025-03-11
任务照片如何更换背景
以下是关于任务照片更换背景的方法: 使用 Segment Anything 中的 GroundingDINO 模型: 1. 启用 GroundingDINO,AI 会自动下载模型,若无法使用魔法,可去云盘下载并放到指定文件目录。 2. 在检测提示词中输入相关内容,如“eye”,AI 可根据语义分割检测并设置蒙版,还可通过预览箱体获取编号来调整单一部分。 更换背景的具体操作: 1. 加载生成的背景蒙版。 2. 选择大模型,如 revAnimated_v122,并设置正向提示词,如“简单背景、花、国画、工笔”,选择蒙版模式为“重绘非蒙版内容”。 后续优化处理: 1. 若头发部分未抠好,可将图片再次放入图生图中,使用 tile 模型做整体细化,为人物衣服添加国风元素。 2. 进入 PS,使用创成式填充修复头发。 此外,在 PS 中也可进行背景替换等操作,如选择照片后使用一键选择主体和移除背景功能,若抠图不精准,可手动创建选区,反选选区后重新创建背景,使用“创成式填充”并添加提示词生成新背景。在 Stable Diffusion 中,还可通过涂鸦重绘添加元素,若想扩展背景可在图生图中选择“缩放后填充空白”并调整相关参数,若想只改变背景而不改变人物,可借助 PS 制作精确蒙版并在 Stable Diffusion 中切换到“重绘非蒙版区域”,调整提示词进行重绘。
2025-03-05
正在搭建客户CRM系统,对于客户拜访跟进记录表格,希望平衡销售人员的录入便捷性和信息完整性,如何通过多维表格接入的AI功能来简化信息录入,比如通过语音录音,直接解析内容。推荐我具体方法,包括怎么解析语音,输出的关键字段,以及提示词
以下是一种通过多维表格接入的 AI 功能来简化客户拜访跟进记录信息录入的方法: 1. 定义任务目标:让 AI 成为您的私人 CRM,即客户管理系统。 2. 编写指令: 定义角色:希望 AI 作为一名顶级的客户服务与销售总监,负责记住客户的爱好与信息。 提供背景信息:简单描述自己的身份,例如负责什么产品的销售。 明确任务目标和输出要求:在每次拜访客户后,把重要信息发送给 AI,要求 AI 每次接到新的客户消息后,只用回复一句“收到,知道了。” 3. 信息录入方式:可以通过语音录音的方式将拜访客户的信息传达给 AI。 4. 语音解析:利用 AI 的语音识别和自然语言处理能力,对语音内容进行解析。 5. 输出的关键字段:可能包括客户姓名、联系方式、拜访时间、拜访内容要点、客户需求、客户反馈等。 6. 提示词:例如“请整理本次拜访客户的关键信息”“提取重要内容并生成表格”等。 您可以参考以上方法,根据实际需求进行调整和优化。
2025-03-07
我是一个AI小白,我使用AI的主要目的是使用这些工具,简化我工作中费时费力的事情,比如:表格的制作,筛选数据;图片的抠图,渲染,产品的口播介绍;日常工厂管理文件的编写及执行步骤;工作手册及岗位绩效的编写;作业指导书的编写
以下是为您整合的相关内容: 对于 AI 小白来说,使用 AI 工具简化工作中的费时费力之事是可行的。 在接触 AI 工具时,对于超出自己理解范围的事情,最简单有效的方法就是尝试。学习新事物,实践比听闻更重要。 比如在 AI 视频制作方面,人物设定与剧本是关键部分,包括主体、动作、场景等要素;分镜处理也较为重要,要考虑用几个镜头表述内容;生成环节如同抽卡,可多尝试,最后进行粗检和后期处理,如 AI 配音剪辑、加过渡滤镜等。小白制作 AI 视频要做好脚本即提示词,有耐心抽卡,并不断提升撰写提示词的能力。撰写提示词时要了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。工具选用方面,没有绝对好的工具,只有适合的,如小白可使用剪映,主力机是 MacBook Pro 可使用 final cut。还可向 ChatGPT 询问获取灵感。 另外,在“AI 布道”活动中发现,AI 工具虽强大能做很多事,但也在其与普通人之间形成了一道墙。AI 是未来必然的方向,其科普还有很长的路要走,但尽可能简单地试用它,能让普通人更快受益。无论是什么身份、什么年龄段的人,都可以尝试使用 AI 工具。 如果您想要跟相关作者交朋友、一起在 AI 路上探寻,欢迎戳这里:
2025-01-30
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
我要在自己的应用中接入AI大模型能力,请问有什么工具或lib可以简化这个过程
以下是一些可以简化在应用中接入 AI 大模型能力的工具和库: 1. 您可以搭建 ,用于汇聚整合多种大模型接口,方便后续更换使用各种大模型。 2. 搭建 ,这是一个知识库问答系统,您可以将知识文件放入,并接入大模型作为分析知识库的大脑,它也有问答界面。 3. 搭建 ,其中的 cow 插件能进行文件总结、MJ 绘画等。 另外,基于 LangChain 平台提供的 LLM 基础模型,也能完成任意模型接口的封装。LLM(语言逻辑模型)是 LangChain 平台与各种大模型进行交互的核心模型,是一个抽象概念,可理解为处理语言输入和输出的黑盒。其输入是字符串表示的用户请求或问题,输出也是字符串表示的模型回答或结果。LLM 能根据不同输入调用不同大模型完成不同语言任务,具有无需关心大模型细节和复杂性、灵活选择切换大模型、可自行封装实现语言逻辑和功能等优势。 在基础通识课中,还提到了一些相关内容,如流式训练方式提升训练速度和质量,多种 AI 生成工具(如 so no 音频生成工具、能创建个人 AI 智能体的豆包、输入文本可生成播客的 Notebook LN),端侧大模型的特点,AI 工程平台(如 define、coach 等),模型社区(如魔搭社区)等。
2024-10-23
AI应用于信息展示除了以下这段还能写啥?人工智能对演示文稿、网页、微信公众号和Markdown工具都有影响,正重塑信息展示领域。例如,AI可以简化演示文稿设计布局的调整;通过AI能分析用户行为,优化网页内容和结构;在微信公众号利用AI实现个性化推送和智能回复,提升响应和互动质量。Markdown也可利用AI实现智能化编辑和检查。
以下是 AI 应用于信息展示的其他方面: 1. GPT4VAct 作为多模态 AI 助手,能够模拟人类通过鼠标和键盘进行网页浏览,基于 AI 的能力、项目目标人群和服务内容类型,可实现未来互联网项目产品原型设计的自动化生成,使效果更符合用户使用习惯,同时优化广告位的出现位置、时机和频率。 2. 在电影制作方面,可综合应用 AI 工具,如使用 ChatGPT 撰写脚本、分镜、人物设定和旁白,使用 Midjourney 生成静态分镜图片,使用 Runway 生成动态分镜片段,使用 AI 配音软件制作旁白。 3. 在写作方面,AI 可用于草拟各类初稿,如博客文章、论文、宣传材料、演讲、讲座等。还能帮助改进已有的文本,以不同风格创建草稿,激发作者创作出更好的作品,以及协助完成如写邮件、创建销售模板、提供商业计划下一步等任务。
2024-08-15
用coze分解短视频分镜
以下是关于用 Coze 分解短视频分镜的详细内容: 一、Coze 智能体创建 1. “开始”节点 共有 4 个输入变量,分别为: idea_txt:主题观点 left_to_txt:画面左上角的文字 right_to_txt:画面右上角的文字 img_prmpot:画面中间图片生成提示词 注意:这 4 个变量名称要和智能体中提示词的变量对应一致,方便接收用户传入的参数。 2. “大模型”节点 使用目前大家公认的 DeepSeek R1 模型。 提示词要求不复杂,只要说出需求即可,格式可用大白话说出来。 3. “文本”节点 为了将文案分句,每一句要生图、配音。 选择按“句号”分句,具体可根据文案格式选择不同方式。 4. “图像生成”节点 使用官方插件,模型选“LOGO 设计”。 若要生成全景图,此插件效果欠佳,建议选其它插件。 5. “抠图节点” 将上个节点生成的图片进行抠图。 二、概述 基于其他博主开源的视频生成工作流,做了一些功能优化,实现视频全自动创建。感谢开源的力量,现写一篇教程供大家参考。 三、先看效果 四、功能 通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 五、涉及工具 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 六、大体路径 1. 通过 Coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 Coze 智能体到飞书多维表格。 3. 在多维表格中使用字段捷径,引用该智能体。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。
2025-02-23
模态分解算法的详细代码
很抱歉,目前知识库中没有模态分解算法的详细代码。但您可以通过以下途径获取相关代码: 1. 学术研究网站,如 arXiv 等,许多学者会在上面分享他们的研究成果及代码。 2. 相关的开源代码库,如 GitHub 等,您可以通过搜索关键词找到相关项目。 3. 专业的技术论坛,在那里与其他开发者交流,可能会获得有用的信息和代码示例。
2024-12-30
(defun 生成记忆卡片 (单词) "生成单词记忆卡片的主函数" (let* ((词根 (分解词根 单词)) (联想 (mapcar #'词根联想 词根)) (故事 (创造生动故事 联想)) (视觉 (设计SVG卡片 单词 词根 故事))) (输出卡片 单词 词根 故事 视觉))) (defun 设计SVG卡片 (单词 词根 故事) "创建SVG记忆卡片" (design_rule "合理使用负空间,整体排版要有呼
以下是关于生成记忆卡片和 SVG 卡片的相关信息: 卡片类的应用被定义为词生卡片,如李继刚的《汉语新解》、一泽的《名片设计》、云中江树的《AI 简历》等,都是通过给大模型优化过的 Prompt,让其生成 HTML 代码或 SVG 代码,再通过浏览器渲染效果。 把提示词丢给 Claude ,如在 Poe 平台上的 Claude 模型,大概率会直接输出 SVG 代码,但对于子步骤是否执行等情况难以知晓。Andrej Karpathy 认为,模型需要 tokens 来思考,如果大语言模型未将思考过程外化,则几乎等于没思考。 甲木介绍了让 Claude 生成古诗词卡片的方法,流程包括输入 Prompt 、用户输入主题和风格,AI 输出最终结果。获取提示词已开源,创作过程主要是根据给定主题和方向生成匹配的中国古诗词,创建设计感强烈、富有中国传统美学的 SVG 卡片展示诗词,并提供相关信息,还支持根据用户提供的主题和方向生成对应语境的 prompt 并配图生成 SVGCard 。但对于“逼格高”的看法因人而异,可将选择权交给 AI 。
2024-11-28
可将复杂任务分解为简单子任务的ai工具是什么
以下是一些可将复杂任务分解为简单子任务的 AI 工具和相关策略: OpenAI 官方指南中提到,对于需要大量独立指令集来处理不同情况的任务,可以首先对查询类型进行分类,并使用该分类来确定需要的指令。例如,在客户服务应用程序中,将查询分类为计费、技术支持、账户管理或一般查询等主要类别,并进一步细分次要类别。 如同软件工程中将复杂系统分解为模块化组件,对 GPT 提交的任务也可如此。复杂任务往往可被重新定义为一系列简单任务的工作流程,早期任务的输出用于构造后续任务的输入。 在 AIAgent 系列中,基于 LLM 的 AI Agent 应首先以适当的方式将复杂任务分解为子任务,然后有效地组织和协调这些子任务,这有赖于 LLM 的推理和规划能力以及对工具的理解。
2024-11-05
什么ai对思路分解做的比较好
以下几种 AI 在思路分解方面具有一定的优势和特点: 1. 专家 AI:鉴于其神经网络基础,可能通过元学习更快地获得知识。通过构建系统深入探索其内部工作机制,能创造学习的飞轮,未来甚至可能成为下一代专家的教师,帮助我们将复杂问题一部分一部分地拆解研究。 2. ChatGPT:在某些实用向话题,如写代码、解数学题等方面表现相对稳定,能够为解决问题提供一定的思路。 3. 大语言模型:可以加速认知提升,指导学习。人类可以利用其培养结构化思维,将复杂问题分解成更小、更易管理的部分,并通过逻辑和有条理的步骤来解决,从而达到解决整体问题的目的。 需要注意的是,不同的 AI 在不同的场景和任务中表现各异,具体的效果还需根据实际需求和使用情况来评估。
2024-11-02
有没有关于工作任务分解为具体步骤的提示词
以下是关于将工作任务分解为具体步骤的提示词相关内容: 提示词工程的任务可分解为两个步骤,如 Pryzant 等人(2023)所做:第一步,模型预期检查当前提示词和一批样本;第二步,模型预期编写一个改进的提示词。 对于复杂任务,可将其分解成更小的步骤,并在提示词中明确每个步骤的具体操作,引导模型逐步完成任务。例如,使用以下逐步说明:步骤 1 用户将提供用三重引号引用的文本。用一个句子总结这段文本,并以“摘要:”作为前缀。步骤 2 将步骤 1 的摘要翻译成西班牙语,前缀为“翻译:”。 如果将任务分解,Claude 在执行任务时犯错或遗漏关键步骤的可能性会降低。 为了鼓励模型仔细检查批次中的每个示例,并反思当前提示词的局限性,可指导提案模型回答一系列问题,如输出是否正确、提示词是否正确描述了任务、是否有必要编辑提示词等。 实际操作中,提示词插入整个输入序列的位置是灵活的,可能位于输入文本之前用于描述任务,也可能出现在输入文本之后以激发推理能力。在元提示词中应明确提示词和输入之间的相互作用。
2024-10-21