Chat with Wiki - WayToAGI

Navigate to WaytoAGI Wiki →

Home/All Questions

RPA 很早就已出现，主要用于工作流编排领域，旨在使符合标准的基于桌面的业务流程和工作流程实现自动化，通常这些操作重复且数量多，可通过规则和结果定义，如今越来越多的 RPA 软件带上了 LLM。近期出现的 ComfyUI 将开源绘画模型 Stable Diffusion 进行工作流化操作，用户在流程编辑器中配置 pipeline，通过节点和连线完成模型操作和图片生成，提高流程可复用性并降低时间成本，其 DSL 配置文件支持导出导入。 Dify.AI 的工作流设计语言与 ComfyUI 有相似之处，都定义了标准化的 DSL 语言，方便导入导出以复用工作流。 Large Action Model 采用“通过演示进行模仿”的技术，收集知识并从用户示例中学习，适应变化和处理不同任务。但 Agentic Workflow 存在一些问题，如使用用户较少，可能因出现周期、上手难度等因素，在复杂流程开发上也不太稳定可靠。单 Agent 模式下，有“技能”“知识”“记忆”“对话体验”等点，将一整套工作流组合，每个工具在节点执行任务，可体验并在工作流中使用。不同 Agent 流程编排开发平台中，workflow 可成为组件被调用，也能嵌套新的 workflow，基础节点、插件工具、LLM、逻辑条件处理等都是输入、输出的组装模块。大模型根源的“不太聪明”，加上 workflow 也无法解决意图理解准确率问题，工作流主要解决流程的可控性，吴恩达老师也提到提升大模型本身质量很重要。 LangGPT 提示词框架应用了 CoT 完成从输入到思维链再到输出的映射，可解决模型规划过程中的路径拆解。

RPA（机器人流程自动化）学习相关内容如下： RPA 很早就已出现，用于工作流编排领域，旨在使符合标准的基于桌面的业务流程和工作流程实现自动化，操作多为重复且数量较多，可通过规则和结果定义，如今不少 RPA 软件带上了 LLM。 ComfyUI 将开源绘画模型 Stable Diffusion 进行工作流化操作，用户在流程编辑器中配置 pipeline，通过节点和连线完成模型操作和图片生成，提高流程可复用性，降低时间成本，其 DSL 配置文件支持导出导入。 Dify.AI 的工作流设计语言与 ComfyUI 有相似之处，都定义了标准化的 DSL 语言，支持导入导出功能进行工作流复用。 Large Action Model 采用“通过演示进行模仿”的技术，检查人们与界面的互动并模仿操作，从用户示例中学习。中小企业可通过任务自动化提高效率和自动化流程。首先评估和识别日常重复性高的任务，确定具体目标并观察记录，然后引入自动化工具，如 RPA 技术，它能模仿人类执行重复性任务，快速部署且成本效益高。关于 RPA+财务税务问答机器人制作，包括直播准备与开场、AI 在税务工作中的应用及实现方式、使用引到 AP 创建税务 AI 智能助手及相关部署、飞书机器人与引到 AP 的结合及相关问题、RPA 产品介绍及应用场景等。杭州分叉智能公司的 RPA 产品可控制桌面软件实现办公流程自动化，RPA 可替代电脑办公中的重复有逻辑工作，适用于开具大量发票、查询出租车违章、朋友圈点赞等场景，多人多部门使用可提高办公效率。

神经网络需要哪些硬件设施才能搭建起来

搭建神经网络通常需要以下硬件设施： 1. 图形处理单元（GPU）：如英伟达的 GTX 580 GPU，其具有大量快速小内核，适合矩阵乘法和高内存带宽，能显著提高训练速度。 2. 专用芯片：如 ASIC 芯片、neuromorphic chips 等，更易于在芯片上实现神经网络的指令集，适用于低能耗的智能设备。此外，搭建神经网络的硬件设施还具有以下特点和优势： 1. 同质化计算：典型的神经网络主要由矩阵乘法和线性整流函数（ReLu）两种操作组合而成，相比传统软件的指令更简单，核心代码（如矩阵乘法）的正确性和性能验证更容易。 2. 对芯片更友好：指令集小，在芯片实现上更轻松，能改变低能耗智能设备的应用场景。 3. 常量级的运行时间：每次前向迭代的计算量高度一致，不存在手写复杂 C++代码中的各种执行分支，能避免未预料的无限循环。 4. 常量级的内存消耗：几乎无需动态分配内存，减少与硬盘的 swap 和内存泄漏的可能。 5. 高度可移植：一连串的矩阵乘法操作更容易在各种计算机环境下运行。

现在哪个ai网站做ppt比较强大？

以下是一些在制作 PPT 方面比较强大的 AI 网站： 1. Gamma：这是一个在线 PPT 制作网站，允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式，如 GIF 和视频，以增强演示文稿的吸引力。网站为：https://gamma.app/ 。 2. 美图 AI PPT：由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计，包含丰富的模板库和设计元素，适用于多种场合。网站为：https://www.xdesign.com/ppt/ 。 3. Mindshow：一款 AI 驱动的 PPT 辅助工具，提供一系列智能设计功能，如自动布局、图像选择和文本优化等。网站为：https://www.mindshow.fun/ 。 4. 讯飞智文：由科大讯飞推出的 AI 辅助文档编辑工具，利用科大讯飞在语音识别和自然语言处理领域的技术优势，提供智能文本生成、语音输入、文档格式化等功能。网站为：https://zhiwen.xfyun.cn/ 。此外，还有以下一些相关网站： 1. Kimi.ai：思维导图图片转 PPT，选 PPT 助手暂时免费效果好，网站为：http://kimi.ai 。 2. Tome.app：AI 配图效果好，网站为：http://Tome.app 。 3. Chatppt.com：自动化程度高。需要注意的是，部分网站可能需要特殊网络环境或付费使用。

视频文案提取，用什么插件

以下是一些可用于提取视频文案的工具和方法： 1. 批量提取文案工具：可以帮助人类提取视频文案。 2. 微信截图工具：能够提取文字。 3. 小程序：可用于提取视频文案和转换文字为语音。 4. 简映等工具：能轻松提取视频文案。 5. 飞书多维表格和 Chrome 插件：通过自动筛选高赞视频、提取文案及进行风格分析，实现一键批量提取、分析和改写抖音视频文案。

langgraph教程

LangGraph 是一个用于低代码构建 LLM 应用的新库，具有以下特点和功能： 1. 提供了更多自定义和循环行为的可能性。 2. 提供了可视化工具，用于展示和控制语言代理的图，以及查看和分析语言代理的输入和输出。 3. 是 LangChain 的一个强大扩展，能支持更多 LLM 应用场景和需求，且是独立库，可与其他 Python 库和工具结合使用。其详细介绍和使用方法可参考官方文档和教程。 LangChain 0.1.0 的发布是重要里程碑和新起点，团队未来计划包括： 1. 重写旧的链，使其符合 0.1.0 的架构和规范，并提供更多功能和特性。 2. 维护稳定分支 0.1.x，用于修复错误和优化性能，保证质量和稳定性。 3. 增加更多工具和功能，如更多 LLM 和 NLP 任务支持、更多输出解析和检索方法、更多代理技术以及更多 LangSmith 和 LangGraph 功能。此外，还有关于利用 Langchain、Ollama、RSSHub 实现本地部署资讯问答机器人的内容，包括导入依赖库、从订阅源获取内容、为文档内容生成向量以及实现 RAG 等步骤。在探索 LangGraph 构建多专家协作模型方面： 1. 定义图：从节点开始，预填充状态，构建定制工作流程，包含多个节点，如 enter_、助手、_safe_tools、_sensitive_tools、leave_skill 等，并逐一明确地定义如航班预订助手、租车助手、酒店预订助手、旅行预订助手和主助手等工作流程图。 2. 对话：在对话轮次列表上运行，减少确认。

LangGraph 是一个用于低代码构建 LLM 应用的新库，具有以下特点和发展情况： 1. 提供了更多自定义和循环行为的可能性，还有可视化工具用于展示和控制语言代理的图，以及查看和分析输入输出。 2. 是 LangChain 的一个强大扩展，能支持更多 LLM 应用场景和需求，且是独立库，可与其他 Python 库和工具结合使用。 3. 随着其发布，应用开发者能在应用层随心搭建自己的多专家模型。 4. 在 LangChain v0.2 中，LangGraph 正在成为构建代理的推荐方式，增加了预构建的 LangGraph 对象，更容易定制和修改。 LangChain 团队未来计划包括： 1. 重写旧的链，使其符合 LangChain 0.1.0 的架构和规范，并提供更多功能和特性。 2. 维护稳定分支，用于修复错误和优化性能，保证质量和稳定性。 3. 增加更多工具和功能，如更多的 LLMs 和 NLP 任务支持、更多输出解析和检索方法、更多代理技术以及更多 LangSmith 和 LangGraph 的功能。详细介绍和使用方法可参考 LangGraph 的官方文档和教程。

请详细讲述一下这个网站《通往AGI之路》的学习方法？

《通往 AGI 之路》的学习方法如下： 1. 系统学习：观看李弘毅老师的生成式 AI 导论、吴达的生成式 AI 入门视频等高质量学习内容，并整理成学习笔记，在整理过程中与大家交流互动。 2. 社区共创学习：对于觉得系统学习枯燥的同学，可以等待社区共创内容，通过共创做小项目来反向推动学习。 3. 了解相关原理：学习 A16Z 推荐的包括 GPT 相关知识、Transformer 模型运作原理、大语言模型词语接龙原理等基础知识。 4. 探索应用：例如了解 Stable Diffusion 运作原理与 GPT 训练现状。 5. 针对特定软件：对于 AE 软件，可在 B 站找丰富的入门课程自学，也可从包图网下载工程文件学习。通过拆解视频、留意路边广告特效、按层级逻辑思考画面运动来学习，还可参考模板。 6. 名词解释：理解包括 AGI、AIGC、agent、prompt 等 AI 相关名词，可通过与 AI 对话或李继刚老师的课程来理解。 7. 信息获取：关注赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等，订阅获取最新信息并投稿。 8. 参与活动：参加如 AIPO、CONFIUI 生态大会等社区活动，每月还有切磋大会。 9. 阅读经典：阅读介绍 GPT 运作原理、Transformer 模型、扩散模型等的经典必读文章，以及软件 2.0 时代相关内容。 10. 初学者推荐：对于初学者，推荐看 Open AI 的官方 Cookbook，小琪姐做了中文精读翻译，也可查看 cloud 的相关内容。同时，整理 open AI 的发展时间线和万字长文回顾等历史脉络类资料。

以下是为您提供的部分 AI 产品榜：全球 AI APP 增长榜通用 Chatbot： 1. ChatGPT 2. 抖音豆包 AI 3. ChatOn 4. Chat&Ask AI 5. Chat with Ask AI by Codeway 6. Kimi 智能助手 7. 文心一言 8. 百度文库文档助手 9. CICI 10. Microsoft Copilot 11. Nova 12. AnyDoor 13. Perplexity 14. ChatBox 15. Grammarly 全球 AI APP 增长榜虚拟角色： 1. Character AI 2. Linky 3. Talkie 4. 星野 5. Poly.AI 6. Akinator 7. Chai 8. MeChat 9. Bible Chat 10. Paradot 11. AI ChatBot:Smart Assistant 12. HiWaifu 13. EVA AI Chat&Clever Chatbot 14. Museland 15. Replika 16. Genesia AI 17. SpicyChat AI:Roleplay Chat ProductHunt 2023 年度最佳产品榜单中的 AI 产品： Dora AI：用一次 prompt 生成网站，可通过一个 prompt，借助 AI 3D 动画，生成强大网站，支持文字转网站，生成式 3D 互动，高级 AI 动画。 Bard（免费）：谷歌推出的官方 ChatGPT 竞争者，由谷歌的对话应用语言模型（LaMDA）提供支持。 Chat.DID（免费）：有史以来首个允许人们以人类方式与 AI 进行视频聊天的 APP，是免费的互动网络 APP，正在将「面孔」重新带回界面，现已进入测试阶段。 Pika（免费）：AI 视频平台，使任何人都能将他们的创意愿景变为现实，通过一款先进的视频基础模型以及一个轻松易用的创作产品，正在重新定义视频制作和编辑方式。

AI绘图换背景

以下是关于 AI 绘图换背景的相关内容：在 Google 的 Gemini 文生图测试中，其能够在短时间内出色地完成抠图、换背景、打光影等工作。例如，无中生有地换背景效果非常好，商业级别的背景合成与打光也能在 10 秒内取得稳定且令人满意的结果。在使用【SD】进行商业换装时，也可以给人物换背景。先启用 GroundingDINO 模型获取更精确的蒙版，如眼睛或配饰等部分。然后选择想要修改的蒙版，添加相关提示词和设置，如选择大模型、正向提示词、蒙版模式等，就能够生成换背景后的图片。如果效果不太理想，还可以进行进一步的细化和修复。在【PS】中，通过选择主体和移除背景的功能，结合创成式填充和添加提示词，可以实现背景的替换。但对于颜色复杂的部分，可能需要手动创建选区以获得更精准的效果。