Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何用AI处理PDF拆分、合并等功能?

Answer

要使用 AI 处理 PDF 的拆分、合并等功能,可以参考以下内容:

  • 对于 PDF 文档的解析,计算机视角下文档分为有标记文档(如 Microsoft Word 和 HTML 文档)和无标记文档(如 PDF 文档)。PDF 文档未存储结构信息,机器难以读取,需要解析器将散乱字符组织成有结构的连贯文本。理想的 PDF 解析器应具备文档结构识别和在复杂布局中保持鲁棒性等关键特征。
  • 基于深度学习的 ChatDOC PDF 解析器在超过一千万份文档页面的语料库上进行训练,包含 OCR 进行文字定位和识别、物理文档对象检测、跨列和跨页调整、阅读顺序确定、表格结构识别、文档逻辑结构识别等一系列复杂步骤。解析后以 JSON 或 HTML 格式提供结果,将文档解析为内容块,包括表格、段落、图表等元素,对于表格会输出单元格文本及合并情况,对于有分级标题的文档会输出分层结构。其在案例中成功解决了 PyPDF 的一些缺点,能识别混合布局、合并单元格等复杂情况。
Content generated by AI large model, please carefully verify (powered by aily)

References

通过增强PDF结构识别,革新检索增强生成技术(RAG)

对于人类来说,浏览任何文档页面的认知过程都是相似的。当我们阅读一个页面时,我们的视网膜会捕捉到字符。接着在我们的大脑中,这些字符被组织成段落、表格和图表,然后被理解或记忆。但计算机是以二进制码感知信息,所从计算机的角度看,文档可以分为两类,如图3所示:图3计算机视角下的两种类型的文档有标记文档(Tagged Documents):例如Microsoft Word和HTML文档,它们包含像<p>和<table>这样的特殊标记,用来将文本组织成段落、单元格和表格。无标记文档(Untagged Documents):例如PDF文档,它存储了每个文档页面上字符、线条和其他内容元素放置位置的指令。PDF文档以人类可读的方式“绘制”这些基本内容元素,但它并没有存储文档的任何结构信息,如表格或段落。因此,无标记文档仅供人类阅读,但机器无法读取。当尝试将PDF表格复制到Word中时,这一点会很明显,因为在Word中原表格的结构通常会完全丢失。然而,大语言模型擅长处理序列化的文本。因此,为了使大语言模型能够有效处理无标记文档,需要一个解析器将散乱的字符组织成具有其结构的连贯文本。理想情况下,PDF解析器应具备以下关键特征:文档结构识别:能够灵活地将页面划分为不同类型的内容块,如段落、表格和图表。这确保了划分的文本块是完整和独立的语义单元。在复杂文档布局中保持鲁棒性(Robustness):即使是在文档页面布局复杂的情况下也能保证解析效果,如多列页面、无边框表格甚至合并单元格的表格。

通过增强PDF结构识别,革新检索增强生成技术(RAG)

接下来,我们转向基于深度学习的解析方法,以我们的ChatDOC PDF解析器为例。ChatDOC PDF解析器(pdflux.com)在超过一千万份文档页面的语料库上进行了训练。按照引用[2]中的方法,它包含了一系列复杂的步骤:1.OCR进行文字定位和识别;2.物理文档对象检测;3.跨列和跨页调整;4.阅读顺序确定;5.表格结构识别;6.文档逻辑结构识别。读者可以参考引用[2]了解这些步骤的细节。解析后,我们用段落和表格作为基本块,然后合并相邻块,直到达到词元(Token)限制以形成一个分块。ChatDOC PDF解析器旨在始终以JSON或HTML格式提供解析结果,即使对于有挑战性的PDF文档也是如此。它将文档解析为内容块,其中每个分块指代一个表格、段落、图表或其他类型的内容元素。对于表格,它会输出每个表格单元格中的文本,并告知哪些单元格被合并成一个新的单元格。此外,对于具有分级标题的文档,它会输出文档的分层结构。总之,解析后的结果就像一个结构清晰的Word文件。图5展示了一个扫描复印页面及其解析结果。左侧展示了文档及识别的内容块(不同内容块用不同颜色的矩形表示)。右侧展示了JSON或HTML格式的解析结果。读者可以参考引用[3]查看这个解析结果的在线演示。图5 ChatDOC PDF解析器的解析结果。放大查看细节。然后,我们查看了ChatDOC PDF解析器在案例1中的结果,如图6所示。它成功解决了PyPDF的三个缺点。

通过增强PDF结构识别,革新检索增强生成技术(RAG)

图6案例一中ChatDOC的解析和分块结果(原文档:[4])。放大查看细节。1.如“3分块结果可视化”部分所示,ChatDOC PDF解析器识别了混合布局,并正确地将整个表格设置为一个单独的分块。对于段落,如“2分块结果”部分中的分块2所示,同一段落中的文本行会被合并到一起,使其更易于理解。1.在“2分块结果”部分的分块1中,我们可以看到表格以Markdown格式表示,保留了表格的内部结构。此外,ChatDOC PDF解析器可以识别表格内的合并单元格。由于Markdown格式不能表示合并单元格,我们在Markdown格式中将合并单元格中的全部文本放入每个原始单元格中。如图所示,在分块1中,文本“Year ended March 31,2021”重复了9次,表示该合并单元格合并了9个原始单元格。1.此外,“Management Discussion and Analysis”和“112 Alibaba Group Holding Limited”被识别为页眉和页脚,它们被分别放置在解析结果的顶部和底部,与阅读顺序一致。另一个案例2为复杂的跨页表格,其解析结果如附录中的图16所示。

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
那些ai工具可以world转pdf
以下是一些可以将 Word 转换为 PDF 的 AI 工具: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 内容由 AI 大模型生成,请仔细甄别。
2025-04-15
那个ai可以world转pdf
以下是一些可以将 Word 转换为 PDF 的 AI 产品和方法: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 另外,还有一种将 PDF 变成可交互网页的方法: 1. 生成 PDF:将文件转换为 PDF 格式,其他文件格式也可以,但 PDF 效果更好。如果希望在文章中加入图片,需要将图片转换为 markdown 格式。如果是网络图片,直接复制图片的 url,右键图片,选择复制 url,然后用 markdown 格式写入文档。如果是自己的图片,可以使用图床服务(比如如 https://sm.ms/)托管图片,生成一个公链。如果想插入视频,也很简单,找到公网的视频地址(自己的本地视频先上传到公网,比如 B 站之类的)。在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项。在得到 url 后,依旧是使用 markdown 格式来写入视频地址。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-15
有没有把pdf转成word的ai
以下是一些可以将 PDF 转换成 Word 的 AI 工具和方法: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-14
如何通过提交的pdf文件自动生成流程图。
目前在 AI 领域,直接通过提交的 PDF 文件自动生成流程图还存在一定的技术挑战。通常情况下,需要先将 PDF 文件中的内容进行解析和提取,然后利用专门的流程设计工具或软件来手动创建流程图。但随着技术的不断发展,未来可能会有更便捷和高效的方法来实现这一功能。
2025-04-13
ai的好用pdf工具有哪些
以下是一些好用的 AI 相关 PDF 工具: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 内容由 AI 大模型生成,请仔细甄别。
2025-03-27
pdf生成视频
以下是关于 PDF 生成视频的相关信息: 将 PDF 转换为可交互网页: 先将文件转换为 PDF 格式,其他格式也可行,但 PDF 效果更佳。 若在文章中加入图片,网络图片可直接复制其 URL,右键图片选择复制 URL 后用 Markdown 格式写入文档;自己的图片可使用图床服务(如 https://sm.ms/)托管生成公链。 插入视频时,先将本地视频上传至公网(如 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项获取 URL,用 Markdown 格式写入。 使用 Adobe Firefly 生成带有文本提示和图像的视频: 在 Advanced 部分,可用 Seed 选项添加种子编号,控制 AI 创建内容的随机性。相同种子、提示和控制设置可重新生成类似视频剪辑。 在 Adobe Firefly 网站(https://firefly.adobe.com/)选择“生成视频”。 在 Generate video 页面的 Prompt 字段输入文本提示,也可在 Image 部分的 Upload 选项使用图像作为第一帧并提供方向参考。添加图像可使生成的视频更符合预期。 在 General settings 部分可确定Aspect ratio 和 Frames per second。
2025-03-22
图片合并的工具
以下是一些常见的图片合并工具及相关信息: 1. Midjourney: /blend 命令允许使用 Midjourney 的 AI 图像生成将多个图像混合在一起。使用时需上传至少两张图像,然后使用命令加上已上传的图像 ID。在单个混合命令中最多可用 10 张图像,参数可调整混合过程中的各种设置。您可以通过了解更多。 2. 星流一站式 AI 设计工具: 框选多张图像后右键,选择“合并为图片(左上角为 Merged Image 标志)”可将组内所有图片(包括空白区域)合并为一张图片。 此外,使用 coze 做智能报表助手时,会从数据库中查询前面存放的图表连接,然后调用合并图片的插件,把几张图表合并成一张大图。
2025-03-20
在coze工作流中,怎样利用下一个代码节点合并前两个代码节点的输出,并以正确的格式输入传入飞书多维表格插件节点
在 Coze 工作流中利用下一个代码节点合并前两个代码节点的输出并以正确格式传入飞书多维表格插件节点的步骤如下: 1. 搭建整理入库工作流: 3.4 大模型节点:提取稍后读元数据。根据对稍后读阅读清单的元数据期望设置大模型节点,使用 MiniMax 6.5s 245k,设置最大回复长度至 50000 以完整解析长内容网页,用户提示词需相应设置。 3.5 日期转时间戳。后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳,需使用「日期转时间戳time_stamp_13」插件进行格式转化,具体设置明确。 3.6 大模型节点:把稍后读元数据转换为飞书多维表格插件可用的格式。飞书多维表格插件目前(2024 年 08 月)只支持带有转义符的 string,以 Array<Object>格式输入,所以要将之前得到的元数据数组进行格式转换,大模型节点配置及用户提示词需相应设置。 3.7 插件节点:将元数据写入飞书表格。添加「飞书多维表格add_records」插件,设置{{app_token}}与{{records}}参数。 3.8 结束节点:返回入库结果。「飞书多维表格add_records」插件会返回入库结果,直接引用该信息用于通知外层 bot 工作流的入库是否成功。 2. 搭建选择内容推荐流: 4.1 开始节点:输入想阅读的内容主题。收到用户输入的“想看 xxx 内容”这类指令开始流程,无需额外配置。 4.2 变量节点:引入 bot 变量中保存的飞书多维表格地址,添加变量节点并设置。 4.3 插件节点:从飞书多维表格查询收藏记录。添加「飞书多维表格search_records」插件,设置{{app_token}}参数,并在{{app_token}}引用变量节点的{{app_token}},输出结果的{{items}}里会返回需要的查询结果,也可在这一步定向检索未读状态的收藏记录。 4.4 大模型节点:匹配相关内容。为处理稳定采用批处理,对检索出来的收藏记录逐个进行相关性匹配,用户提示词可优化以提升匹配精准度。 搭到这里,别忘了对整个工作流进行测试。
2025-01-09
coze合并代码节点
以下是关于 Coze 合并代码节点的相关内容: 在 Coze 上搭建工作流框架时,设定每个节点的逻辑关系很重要。对于「分段」、「拼合」代码节点设计,实际测试表明由于 LLM 的上下文长度有限,通常一次性输入输出的文本越长,生成时间越长,结果稳定性越低,特别是对生成结果格式要求较高时问题更突出。考虑到对照精读环节本身是逐段生成的,适合批处理形式,所以需要用「分段输入正文」,分割正文后用 LLM 节点批处理每一段的对照精读,最终「拼合精读结果」以输出完整文本。如果觉得编写代码脚本繁琐且仅进行文本处理,也可使用 LLM 节点配合适当 prompt 临时验证整个工作流。 在插件中心确定需要的插件时,先用关键词尝试性搜索,根据插件名称、介绍页、描述、参数、示例判断是否可能满足需求。有多个插件可选时,一般优选官方/高收藏/高成功率的插件以提升使用效果。若实际试用效果不行,则换用其他插件或自己编写上架插件。例如 TTS 文字转语音插件可通过搜索“语音”“文字转语音”“TTS”等相关关键词找到“英文文本转语音”插件;思维导图插件可通过搜索“脑图”“树图”“导图”“mindmap”等关键词找到“TreeMind 树图”插件。 Coze 工作流节点还包括大模型节点、代码节点和选择器节点。大模型节点可利用大语言模型生成文本内容,能选择所用大语言模型、设置生成内容随机度并编写提示词,提示词中支持使用{{variable}}引用输入参数。代码节点通过 IDE 编写 Python 或 JavaScript 脚本处理输入参数并返回输出值,支持 JavaScript 和 Python 运行时,尽量使用 JavaScript,尽量让 AI 去写,不熟悉时易增加麻烦。选择器节点是一个 ifelse 节点,用于设计工作流内的分支流程,每增加一个条件右边会多出一个点,点中拖到对应的下一级节点,输入参数时节点会判断是否符合“如果”区域条件,符合则执行对应分支,否则执行“否则”分支。
2025-01-09
有没有能将提供的文章内容改写合并的提示词?
以下是一些能够将提供的文章内容改写合并的提示词示例: 对于政府机关材料写作者的提示词: Role:人物精神写作笔杆子,Profile 包含作者、版本、语言、描述等信息,Goals 是根据提供的材料生成完整文体,Constrains 有对未知信息的处理、调用数据库等,Skills 包括文章撰写和排版审美,Workflows 有具体步骤。 对于联网的科普作者的提示词: Role:科普作者,Profile 包含作者、版本、语言等信息,Goals 是根据关键词解读新闻,Constrains 有准确性、清晰性、公正性和及时性要求。 对于新闻文章的事实核查员的提示词:角色为新闻文章的事实核查员,个人信息包含作者等,目标是区分事实和观点等,约束有对事实和观点的处理方式,Skills 包括区分能力和使用格式化技术,工作流程分多步进行。
2024-10-15
如何让对话几条消息合并意图回复
默认情况下,Cursor Chat 位于 AI 窗格中,与您的主要侧边栏相对。用户消息包含您键入的文本以及您引用的上下文。您可以返回任何以前的用户消息来编辑和重新运行查询,这将覆盖此后的所有消息并重新生成新消息。AI 消息是您选择的 AI 模型生成的响应,它们与前面的用户消息配对,可能包含已解析的代码块,这些代码块可以通过添加到您的代码库中。同一线程中的所有用户/AI 消息称为聊天线程,每个聊天线程都保存在您的聊天历史记录中。
2024-09-16
哪个AI工具可以上传多个文档,然后把内容理解合并生成一份总结
根据搜索结果,有几款AI工具可以上传多个文档,并理解合并生成一份总结: 1. ChatDOC 是一款AI文献阅读和文档处理工具,它允许用户上传文档,并与AI进行对话来处理专属数据。ChatDOC通过智能分析文档内容,帮助用户快速获取文章摘要、深挖特定观点和数据、翻译文本、总结内容等。此外,它还支持追问功能,允许用户进行多轮问答,以深入挖掘文本结构和内容 。 2. 通义听悟 是阿里云推出的AI助手,它支持在多种场景下实时转录和音视频转文字,智能生成总结。该工具可以快速标记关键信息,并且识别结果和笔记能够轻松导出至本地或储存在阿里云盘 。 3. EasyPeasy.AI 提供了一个“合并文本”的模板,该模板可以帮助用户合并多个文档的内容。用户可以使用这个工具来整合和生成一份总结 。 这些工具通过AI技术帮助用户从多个文档中提取关键信息,并生成简洁的总结,非常适合需要处理大量文档并快速获取信息的场景。
2024-07-04