Navigate to WaytoAGI Wiki →
Home/All Questions
如何搭建公司的轻量知识agent
以下是关于搭建公司轻量知识 agent 的相关信息: Coze: 是字节跳动旗下子公司推出的 AI Agent 构建工具。 允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent。 可以白嫖海量大模型免费使用,有丰富的插件生态。 其他 Agent 构建平台: Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板,功能强大且开箱即用。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 您可以根据公司的具体需求选择适合的平台进行进一步探索和应用。
2025-03-12
core案例拆解教程
以下为为您提供的几个案例拆解教程: Coze 应用实战指南 吐槽心灵鸡汤 核心功能说明:一个允许用户输入心灵鸡汤类内容,AI 生成对应的反心灵鸡汤,并展示在前端页面的应用。 核心操作流程拆解: 1. 用户在页面输入指定文本。 2. 用户在页面点击【开喝】按钮。 3. Coze 后台调用工作流生成对应内容。 4. 工作流生成的内容展示在前端界面内。 核心前端设计拆解: 1. 用户界面提供一个元素 A(Coze 中称作组件),让用户输入内容。 2. 用户界面提供一个按钮 A,让用户点击后调用工作流。 3. 用户界面提供一个元素 B,向用户展示工作流的结果。 核心业务逻辑拆解: 1. 读取元素 A 的用户输入。 2. 将用户输入传递给 AI 大模型。 3. AI 大模型按照提示词设定生成指定内容。 4. 在元素 B 展示 AI 大模型生成的内容。基于上述业务逻辑,只需要设计一个简单的工作流即可,该工作流由【开始】节点(用户输入)、【大模型】节点(AI 生成内容)、【结束】节点构成(内容输出)。 Pika 新功能“Pikadditions” 厕所开门见猴 原视频:人物推开厕所门→空马桶镜头。 角色图片:一张猴子坐在马桶上的图片。 提示词:“When the door opens in the video,we see a monkey with reading glasses sitting in the toilet reading a book.” 拆解逻辑: 1. 时间触发:When the door opens→绑定视频动态事件(门开合过程)。 2. 空间绑定:sitting in the toilet→将猴子坐标锁定在马桶实体上。 3. 行为设计:reading a book→赋予角色符合场景逻辑的行为(厕所常见活动)。 4. 细节强化:with reading glasses→用视觉符号增强角色合理性(模仿人类行为)。 首尾帧循环视频制作 宇航员案例 1. MJ 生成宇航员近照。 2. 截取头盔中反射的宇航员作为第 3 步垫图和 sref 使用。 3. 生成与头盔中宇航员接近的半身像。 4. 打开即梦,选择使用尾帧。重点:一般情况可以不选择运镜控制,但这张图需要选择变焦推进,控制镜头推进到头盔里,不然 AI 会自己选择更容易实现的后拉运镜。 5. 得到。 6. 同样的做法得到尾帧回到首帧的视频,再用剪映拼接一下两段视频即可得到在他人与自己中无限轮回(有时候起始或结束有停顿,保证整条视频衔接流畅可以掐掉)。
2025-03-12
声音克隆工具
以下是为您介绍的声音克隆工具: GPTSoVITS 是一个声音克隆和文本到语音转换的开源 Python RAG 框架。它具有以下特点: 1. 零样本 TTS:输入 5 秒的声音样本即可体验即时的文本到语音转换。 2. 少量样本训练:只需 1 分钟的训练数据即可微调模型,提高声音相似度和真实感,模仿出来的声音更接近原声且更自然。 3. 跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 4. 易于使用的界面:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具,帮助初学者更容易地创建训练数据集和 GPT/SoVITS 模型。 5. 适用于不同操作系统:项目可以在不同的操作系统上安装和运行,包括 Windows。 6. 预训练模型:项目提供了一些已经训练好的模型,您可以直接下载使用。 GitHub 地址: 视频教程: 此外,语言克隆初创公司 ElevenLabs 完成了 8000 万美元 B 轮融资,开发了逼真声音克隆工具,可调整语调、情感,并计划年底前团队扩展至 100 人。 开源的数字人组合方案中,第一步先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTSoVITS 克隆声音,做出文案的音频。第二步使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址:https://github.com/Rudrabha/Wav2Lip 产品:https://synclabs.so/
2025-03-12
AI生成图表
以下是为您整理的关于 AI 生成图表的相关内容: Napkin:这是一款能够生成多样风格图表的 AI 工具。它可以将选中文本转换为 mermaid 格式图表,支持 SVG 渲染,交互流畅且模板丰富。后台可能使用轻量模型(如 GPT4 mini),自动选择图标,生成多套模板供选择。当前免费,适合需要快速生成图表的用户。相关链接: 创建项目管理流程图(Lucidchart): 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 Liblibai 文生图简易上手教程: 1. 定主题:确定生成图片的主题、风格和表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找内容重叠的 lora 以控制图片效果及质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设成 2。 6. Prompt 提示词:用英文写生成需求,使用单词和短语组合,用英文半角逗号隔开。 7. 负向提示词 Negative Prompt:用英文写避免产生的内容,单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考 checkpoint 详情页中模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,一般在 30 40 之间。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。
2025-03-12
大模型企业落地方案有哪些
大模型企业落地方案主要包括以下几个方面: 1. 提高内容可信: 做具备通用能力的大模型,通过商业交付应用、反馈和评测来解决内容可信问题。 不断优化数据以解决实际应用问题,如自我学习能力等。 走向垂直化,结合场景用一个模型和框架提高内容精准度。 2. 解决算力成本高、训练重复和资源紧缺的问题: 以 GPT3 模型为例,现有千卡集群训练一个月,单次训练周期一个月,总成本超过 1200 万美金,且全行业训练卡持续涨价。 目前仍无人能用商业化的国产芯片做大模型训练。 3. 降低大模型价格或使用垂直领域模型落地。 4. 以百度智能云为例: 在 IaaS 层,百舸 AI 异构计算平台解决算力问题,提供从集群创建到模型训练、推理的完整算力管理方案,提升算力管理能力和模型训练效率,确保高达 99.5%的有效训练时间,为大模型应用落地提供强大算力支撑。 在 Paas 层,千帆大模型平台解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,提供全面工具链,支持定制化模型开发,通过 AppBuilder 提供企业级 Agent 和企业级 RAG 开发能力,还能将企业应用数据反馈到模型中形成良性循环,持续优化模型性能。 在 SaaS 层,提供丰富的常用应用供客户选择,如数字人平台曦灵、智能客服应用客悦等。 此外,大模型在实际应用中存在一些问题,如知识的局限性、幻觉问题和数据安全性问题,而 RAG 是解决上述问题的一套有效方案,它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。RAG 可以和微调结合使用,两者并不冲突。
2025-03-12
怎样用AI生成行业每周内容分析简报
以下是使用 AI 生成行业每周内容分析简报的方法: 1. 项目目的: 目标:通过 AI 工具每天生成【画小二日报】,替代传统人工整理 AIGC 行业资讯。 思路:解决问题不止一种方法,多种思路各有优劣,重要的是锻炼实际应用中的问题解决能力。 2. 效果演示:通过方法一生成画小二日报 Demo 演示,可查看。 3. GPTs 画小二日报: OpenAI 的 GPTs:构建 GPTs 需要是 GPT4 的付费用户。 创建画小二日报的 GPTs:按照图片中标注的步骤操作。 Instruction 的 Prompt:请牢记这个英文单词。 4. 使用工具:扣子 Coze 创建 Bot:网址 https://www.coze.cn,后缀是 com 是国际版,可免费白嫖 GPT4。 编辑界面。 截图示意:提示词、插件选择 getToutiaoNews,引用插件生成对应内容。 Prompt 提示词。 输出结果。 5. 获取指定网站内容: 指定网站:如 36kr 网站 AI 频道资讯:https://36kr.com/information/AI/。 在 Coze 中的提示词。 输出结果。 6. 使用工作流重写: 工作流思路:将获取的新闻让大模型重新按照自己的风格创作新闻内容,可自定义风格,加入个人元素防止拷贝。 搭建工作流:使用到的组件包括 GetToutiaoNews、大模型,工作流布局。 GetToutiaoNews 配置。 大模型配置:根据输入内容,按照平易近人和搞笑的风格写标题,以科普博主画小二的口吻描述,写 100 左右的新闻概要,注意人设与回复逻辑。 7. 使用 Webpilot 插件: 原因:省去工作流,获取新闻列表并让 Webpilot 分析。 解题思路:首先获取新闻列表,其次让 Webpilot 分析对应的内容并输出,思考后续是否可跟大模型重写及相关问题。 8. 同步飞书:数据同步到飞书可变为训练数据。 9. 粉丝交流学习群:包括 AIGC 商业案例实操课、画小二微信交流群、画小二微信公众号。
2025-03-12
LangGPT
LangGPT 是由云中江树提出的结构化提示词框架。云中江树早在 2023 年 3 月就提出了结构化构建提示词的方法,并发布在 Github,很快收藏破千。2023 年 5.4 青年节开源发布(GPT4 发布后约一个月多)为 LangGPT 项目,成为 GitHub 开源社区全球趋势热榜前十项目,并撰写了学术论文开源发表。其提出的结构化提示词已被百度、智谱、字节、华为等国内主流大模型智能体平台使用,当前已发展成为国内最具影响力的高质量提示词工程师学习交流社群。 相关视频和活动分享包括: 【LangGPT 项目】 【结构化 prompt】 【提示链 Prompt Chain】 【DALLE3】 北京分队成员包括: 甲木ゞ:LangGPT 联合创始人/大厂攻城狮,多年服务端开发经验,目前持续深研 AI 提示工程领域,对企业增效赋能,熟悉各类大语言模型。《中国生成式人工智能应用与实践》报告技术顾问,业余也玩 MJ/Pika/Gen2 等等,持续输出,持续进步。目前主要运营 LangGPT 社区,坐标北京朝阳。 子龙一身都是宝:职业为独立游戏制作人/广告行业 AIGC 工作流开发者/连续创业者。技能包括 ComfyUI 工作流开发、汽车行业广告创意图生成、SVD 视频制作、UE4/5,坐标燕郊。 乖乖:技能包括 ps,视频剪辑,公众号编辑,H5 等。初入 AI 领域,正在学习中。职业为人事行政经理,曾在房地产、互联网、餐饮企业任职,组织过年会,万达好声音等活动,参与过企业宣传片创作。兴趣爱好为骑行,跟小伙伴交流信息,提高认知,坐标朝阳北苑。
2025-03-12
AI赛事网站
以下为一些 AI 赛事网站及相关信息: 【灵璧 AI】安徽文创 截止日期:0115 0315 奖金奖项:一等奖 2k1,二等奖 1k2,三等奖 8005 主题+作品类型:赛道一为数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二为互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三为数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。 关键要求:只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。 提交方式:邮箱 链接: 创无界智未来·文旅应用赛 截止日期:0101 0330 奖金奖项:一等奖 10w1,二等奖 6w2,三等奖 3w3 主题+作品类型:四个赛道 关键要求:模糊 提交方式:官网 链接: 【凌家滩】AI 创作大赛 截止日期:0101 0415 奖金奖项:一等奖 2w1,二等奖 8k2,三等奖 2k3,优秀奖 010 主题+作品类型:“文化遗产的数字化重现与未来表达”AI 图像/AIMV/AI 视频 关键要求:无 提交方式:无 链接: Project Odyssey 第二季 视频和图像:Civitai, Kling AI, Viggle, Hailuo, Hedra, RunPod, Higgsfield, ThinkDiffusion, neural frames, Genmo, fal, LTX Video, CogVideoX, Morph Studio, Domo, Haiper, Pony Diffusion, Leonardo AI, Rubbrband 音频:ElevenLabs, Hailuo, Cartesia, Sync, Tunes by Freepik 3D:Playhouse, Playbook, Tripo AI 故事板:SAGA 截止日期:12 月 16 日正式启动 奖金奖项:共涵盖 9 大参赛类别,超 40 个现金奖项累计 7 万美元,还提供价值超 75 万美元的 AI 工具免费试用额度 主题+作品类型:无 关键要求:无 提交方式:比赛现已开放注册,加入等候列表,12 月 16 日起即可解锁超 30 种免费试用 链接: 赛事官网:https://www.projectodyssey.ai/ 注册地址:https://projectodyssey.myflodesk.com/season2 赛事 Discord:https://discord.com/invite/projectodysseyai 智绘未来【台州】AI 大赛 截止日期:0122 0309 奖金奖项:①一等奖 5k1,二等奖 2k3,三等奖 1k5,台州奖 1k1;②一等奖 5.5k1,二等奖 2.5k2,三等奖 1.5k3,台州奖 1k1 主题+作品类型:AI 绘画赛道,AI 视频赛道(60S 以上) 关键要求:分辨率 2K 以上,【加分项】展现台州自然风光、人文历史、城市印象等元素,对台州未来景象的想象,或对台数字馆的未来想象相关的台州元素(额外在总分值增加 10%的分数) 提交方式:AITOP100 平台,投稿后必须转发至小红书分享并带上话题智绘未来+关注官方账号@台州数字馆。 链接:
2025-03-12
我想知道现在中国网络环境内可以用的最好图片AI,以图生图稳定
目前在中国网络环境内可用的较好的以图生图且较为稳定的 AI 产品有: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格可选,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 此外,关于 Stable Diffusion 还有一些相关的使用技巧和处理步骤: 用 GFPGAN 算法将人脸变清晰,可参考文章。 将图片发送到图生图中,打开 stableSR 脚本放大两倍,该放大插件是所有插件中对原图还原最精准、重绘效果最好的,可参考文章。 使用 Stable Diffusion 中的【X/Y/Z plot】脚本做参数对比,如设置 X 轴为提示词相关性,Y 轴为重绘幅度等。绘图时可通过增加提示词、使用画笔工具等进行局部修改和重绘。
2025-03-12
AI学习路径
以下是为新手提供的 AI 学习路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 另外,如果您偏向技术研究方向,学习路径包括: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 如果您偏向应用方向,学习路径包括: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-12