Navigate to WaytoAGI Wiki →
Home/All Questions
WaytoAGI是什么?按什么顺序学习
WaytoAGI 是一个涉及多个方面的学习和交流项目,包含以下内容: 1. 大模型在 B 端场景的应用相关资料。 2. ComfyUI 共学计划,有详细的日程安排,包括不同课程的时间、讲师、资料以及活动记录等。 3. 创造星期四活动,这是社区创造者板块的首场线下活动,旨在帮助程序员成长为 AI 应用开发者或创造者,活动通过特定方式降低学习门槛,快速进入 AI 领域,包括微信机器人的部署、迭代式改进等,活动对象为 Nokia 中感兴趣的开发者,时间为 4 月 18 日晚上 19:30 21:30,还有相关的话题内容和资料。 关于学习顺序,目前提供的信息中未明确给出统一的标准学习顺序,您可以根据自己的需求和兴趣,选择从感兴趣的部分入手。
2025-03-24
好用的人声合成AI
以下是一些好用的人声合成 AI 相关内容: 1. 关于 AI 孙燕姿的生成: 推荐归臧写的通俗易懂的教程: 《》 《》 项目主要使用 SoVITSSVC 4.0,可在。 模型使用分为原始声音处理、推理过程和音轨合并三个部分。使用 UVR_v5.5.0 软件处理声音,保留人物的干声。运行整合包的 Web UI 进行声音推理,需将模型文件和配置文件放置正确文件夹下。分割后的素材尽量不要超过显存大小,使用【slicergui】软件进行分割。最终得到的处理好的人声素材可用于训练模型。 2. 深度伪造技术: 深度伪造技术(deepfakes)是利用 AI 程序和深度学习算法实现音视频模拟和伪造的技术,投入深度学习的内容库越大,合成的视音频真实性越高,甚至能以假乱真。 粉丝们会通过 Stems 音轨分离工具将人声与原始歌曲分离,再使用人声转换模型将人声转换成另一位明星的风格,然后将新的人声轨道与原始作品重新拼接在一起。DiffSVC 是一种流行的用于此目的的语音传输模型。 3. 制作 AI 古人骂人视频: 声音克隆: 工具:Fish Audio 操作:准备一段需要克隆的音频(可以是类似屈原的古风声音,或自行录制一段),打开网站 https://fish.audio/zhCN/train/newmodel/ ,上传音频,按照指引完成声音克隆,进入声音库选择需要使用的声音,将生成的文案输入,使用克隆好的声音生成对应的音频文件并下载备用。 视频合成: 工具:Viggle.ai 操作:在网上下载“回答我”的原视频,打开 Viggle.ai 网站(https://viggle.ai/createmix ),登录后上传“回答我”原视频和人物形象图生成新版本视频,预览效果并下载。 视频剪辑: 工具:剪映 操作:打开剪映软件(手机或电脑版均可),导入合成好的新视频和生成的音频文件,将音频与视频时间轴对齐,添加字幕等,如需叠加特殊背景,可导入自己的背景图(如楚国风景),预览整个视频,检查效果并微调后导出最终视频。 请注意版权问题,请勿侵犯他人音乐版权。
2025-03-24
coze小红书爆款文章生成助手
以下是关于 Coze 小红书爆款文章生成助手的相关内容: 1. 画小二的 Coze 工作流配置:包括抖音热门视频转小红书图文的详细参数配置,如整体结构图、开始模块、Get_Video 模块、LinkReaderPlugin 模块、标题大模型、内容大模型、图片 Prompt 大模型、文生图 ImageToolPro 以及输出结果的参数配置。在标题和正文生成方面,有具体的要求和技能,如采用二极管标题法、使用爆款关键词、遵循小红书平台标题特性、保证正文口语化且长短在 200 字左右等。 2. 一泽 Eze 提出的样例驱动的渐进式引导法:强调精彩的 Prompt 对驱动 AI Agent 稳定运作的重要性,指出高质量 Prompt 依赖用户的逻辑思考和知识经验抽象表达,介绍了通过 12 个初始样例引导 AI 定制完美提示词的方法。 3. 雪梅 May 的 AI 学习日记:记录了对 Coze 的学习过程,包括了解到 Coze 是字节跳动的 AI agent 产品,可用工作流方式制作 AI 智能体,如爸妈防骗助手、热点文章生成器等,并分享了自己对 Coze 的初步理解,认为它能让无技术背景的人实现想法。
2025-03-24
Coze 智能体 教程
以下是关于 Coze 智能体的教程: 一泽 Eze 的教程:可能是全网最好的 Coze 教程之一,一次性入门 Coze 工作流。即使是非技术出身的爱好者也能上手跟学,包括通过实际案例演示构建能稳定生成结构化内容的 AI Agent、开源 AI Agent 从设计到落地的全过程思路、10+项常用的 Coze 工作流配置细节、常见问题与解决方法等。适合玩过 AI 对话产品的一般用户和对 AI Agent 工作流配置感兴趣的爱好者。注:本文不单独讲解案例所涉及 Prompt 的撰写方法,文末「拓展阅读」中有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容。 12.Agent 相关比赛中的 Coze 教程: 基础教程: 大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库 大聪明:保姆级教程:Coze 打工你躺平 安仔:Coze 全方位入门剖析免费打造自己的 AI Agent 基础教程:Coze“图像流”抢先体验 YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档 Coze 变现模板全新升级: 超级管理员和普通用户的角色定义:超级管理员拥有管理整个系统的最高权限,普通用户没有项目配置权限和进入管理后台页的权限。 智能体配置模式: 模式 A:Zion 默认智能体,适用于测试,系统自动填充相关信息,项目自动创建完成,后续可在“管理后台”修改。 模式 B:你的 Coze 智能体,需要在“管理后台”页自行配置在 Coze 平台上获取的相关信息。
2025-03-24
"如何使用Midjourney"
以下是关于如何使用 Midjourney 的详细介绍: 1. “人物参考”功能: 在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;在强度 0(`cw 0`)时,只会关注面部,适合改变服装、发型等。 2. 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 过程:上传单张或者一组(4 到 5 张)到 Midjourney 输入框里,有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+所描述的关键词。 常见问题:小白新手找不到输入框频道。解决方法是找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 3. Midjourney V6 更新角色一致性命令“cref”: 官方说明:在提示后键入`cref URL`,其中 URL 是一个角色图像的网址。可以使用`cw`来修改参考的“强度”。 用途:这个功能在使用由 Midjourney 图像制作的角色时效果最佳,不适用于真实的人物/照片。 高级功能:可以使用多个 URL 来混合信息/来自多个图像的角色。 在网页 alpha(测试最初版)上的操作:拖动或粘贴图像到想象栏,有三个图标。选择这些图标设置它是一个图像提示,一个风格参考,还是一个角色参考。按住 Shift 键选择一个选项以将图像用于多个类别。 需注意,虽然 MJ V6 还处于 alpha 测试阶段,但这个和其他功能可能会突然更改,V6 官方 beta 版本即将推出。
2025-03-24
有哪些AI工具可以帮助产品经理
以下是一些可以帮助产品经理的 AI 工具: 1. 用户研究、反馈分析:Kraftful(kraftful.com) 2. 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 3. 画原型:Uizard(https://uizard.io/autodesigner/) 4. 项目管理:Taskade(taskade.com) 5. 写邮件:Hypertype(https://www.hypertype.co/) 6. 会议信息:AskFred(http://fireflies.ai/apps) 7. 团队知识库:Sense(https://www.senseapp.ai/) 8. 需求文档:WriteMyPRD(writemyprd.com) 9. 敏捷开发助理:Standuply(standuply.com) 10. 数据决策:Ellie AI(https://www.ellie.ai/) 11. 企业自动化:Moveworks(moveworks.com) 此外,AI 在产品经理工作中的实用场景还包括: 1. 辅助精读论文:能帮翻译、拆解公式,分析代码等。工具:https://scispace.com 2. 写一些小脚本:写 SQL 查询、Python 脚本、正则表达式、图片批量处理等。 3. 产品宣传文案:根据产品宣传渠道写营销文案、营销邮件、产品上架文案等。 4. 调研问卷设计/整理:生成调研框架,回收非结构化问卷,按指定框架生成指定表头表格。 5. 竞品分析:用 BingChat 或 ChatGPT Browsering 插件,按指定框架对比各项数据。如 DAU、用户结构、市场占比等等。 6. 解释专业名词:很多垂直领域,都有不少缩写或行业黑话,可以用 ChatGPT 解释举例、给场景说明。 银海推荐的产品经理 AI 助手 PMAI 是一款面向产品经理的生产力工具,具有一键生成 PRD、输出解决方案、生成 SQL 等实用功能。产品体验地址:https://www.pmai.cn/?utm_source=qoZaR5O 相关介绍视频: 微信公众号原文:https://mp.weixin.qq.com/s/XZ4XhpEKwcDRBBfINHjUYg
2025-03-24
我是一个产品经理,我想要绘制ai agent对现有业务流程的提升ppt,有没有一些好的案例
以下是一些关于 AI Agent 对现有业务流程提升的案例,希望对您绘制相关 PPT 有所帮助: 1. 在查询问题方面,如使用 Kimi Chat 时,它会在互联网检索相关内容并总结分析给出结论,这是大模型利用“网页搜索”工具的典型例子,同时 PPT 中还介绍了众多不同领域类型的工具,为大模型在获取、处理、呈现信息上做补充。 2. 在任务执行的工作流路径规划方面,Agent 能够自行规划,面向简单或线性流程运行。例如,先识别男孩姿势,再找姿势提取模型、姿势图像模型、图像理解文本模型和语音合成模型来完成流程任务。 3. 在多智能体协作方面,吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色,如公司 CEO、产品经理、设计师、代码工程师或测试人员等,这些 Agent 相互协作共同开发应用或复杂程序。 4. 对于 AI Agent 的基本框架,OpenAI 的研究主管 Lilian Weng 提出“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型 LLM 扮演了 Agent 的“大脑”。规划主要包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标,处理复杂任务,并对过去行动进行自我批评和反思,从错误中学习改进未来步骤,提高最终结果质量。 5. 在信息处理方面,近期出现的各类 AI 搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,不断颠覆传统搜索引擎。智能摘要功能能辅助快速筛选信息,实现信息降噪。 6. 在信息表达方面,现在用自然语言描述一句话就能生成美观可用的图片,降低了不同角色的创作门槛和周期。 7. 对于产品经理的工作流,可使用 AI 进行搞定用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。但建议先摸清自己的日常工作流,再根据工作节点线索找到适合自己的工具。 关于 Agent 的未来,曾被认为异想天开的想法都可能成为现实,技术迭代会不断向前。同时,在法律法规方面,相关生命周期参与者应实施适当的透明度措施,直接受 AI 系统使用影响的各方应能获取足够信息以维护自身权利,技术标准也可为评估、设计和改进 AI 系统的透明度和可解释性提供指导。
2025-03-24
免费增强图像分辨率的
以下是一些免费增强图像分辨率的工具和方法: 1. Kraken.io:主要用于图像压缩,但也提供免费的图像放大功能,能保证图像细节清晰度。 2. Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术放大图像并赋予艺术效果,支持多种滤镜和风格。 3. Waifu2x:提供图片放大和降噪功能,使用深度学习技术提高图像质量,保留细节和纹理,简单易用效果好。 4. Bigjpg:强大的图像分辨率增强工具,使用神经网络算法加大图像尺寸,提高图像质量,处理速度快。 此外,还有以下相关资源: 1. 【超级会员 V6】通过百度网盘分享的 Topaz 全家桶,链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 ,提取码:16d1 ,复制这段内容打开「百度网盘 APP 即可获取」。 2. RealESRGAN:基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次后要收费。 3. InvSR:开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤(支持 1 5 的材料步骤)即可增强图像,可以高清修复图像。地址、在线试用地址:https://github.com/zsyOAOA/InvSR?tab=readme ov filerailway_car online demo 、https://huggingface.co/spaces/OAOA/InvSR 。 4. GIGAGAN:https://mingukkang.github.io/GigaGAN/ 。 5. Topaz Gigapixel AI:https://www.topazlabs.com/gigapixel ai 。 6. Topaz Photo AI:https://www.topazlabs.com/ 。 7. discord:https://discord.gg/m5wPDgkaWP 。
2025-03-24
AI数字员工
AI 数字员工是为企业和个人提供数字劳动力,解决重复性、创意性工作难题的一种应用。以下是关于 AI 数字员工的一些详细信息: 摊位活动主题和内容:为企业和个人提供数字劳动力,解决重复性、创意性工作难题。体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。 学习路径:结合“一人公司”的愿景,需要大量的智能体(数字员工)替我们打工。未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。创造者的学习方向是用大模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。Agent 工程(基础版)如同传统的软件工程学,有梳理流程、“任务”工具化、建立规划、迭代优化等迭代范式。 数字人相关技术: 算法驱动的数字人:开源代码仓库包括 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition)、AI Agent(大模型如 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc)。 人物建模模型可以通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果。但简单的构建方式还存在一些问题,如生成指定人物的声音、TTS 生成的音频精确驱动数字人口型及动作、数字人使用知识库做出专业性回答等。
2025-03-24
知识库
以下是关于知识库的相关内容: 在 Coze 中配置知识库: 创建好知识库后,可在智能体中进行配置。在 Coze 主页的个人空间>项目开发中,打开需添加知识库的智能体,能选择配置“文本”、“表格”、“照片”三种知识库。以配置文本知识库为例,点击加号选择提前创建好的知识库并添加。之后配置提示词让智能体自动使用知识库回答问题,点击右上角“优化”可自动优化提示词以获得更好结果,最后在“预览与调试”中测试智能体是否正常调用知识库。 创建智能体时的知识库: 手动清洗数据:创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,可选择飞书文档、自定义等操作,添加 Bot 后可在调试区测试效果。 本地文档:注意拆分内容以提高训练数据准确度,如对于画小二课程,按章节进行人工标注和处理,然后选择创建知识库自定义清洗数据。 发布应用:点击发布,确保在 Bot 商店中能搜到。 知识库概述: 扣子提供了几种存储和记忆外部数据的方式,以便 Bot 精准回复用户。知识库是大量知识分片,通过语义匹配为模型补充知识,如车型数据中每个分段保存一种车型基础数据。同时还介绍了数据库、AI 便签、单词本等相关内容。
2025-03-24