Navigate to WaytoAGI Wiki →
Home/All Questions
AI直播
以下是关于 AI 直播的相关信息: 1. AI 春晚: 是由 WaytoAGI 社区组织,由 300 多位 AI 爱好者共同创作的 AI 作品。 运用了多种先进技术,包括数字人 AI 生图文声视频、AI 转会、AI 音乐模型训练等。 作品时长约 150 分钟,涵盖多种类型节目。 于 24 年大年初一当晚直播,18 万人在线观看,后续视频播放量超 200 万,媒体曝光量超 500 万。 多个节目登录央视网,孵化了数个优质项目与团队。 完整版链接:https://www.bilibili.com/video/BV15v421k7PY/?spm_id_from=333.999.0.0 相关进度: 2. AI 梦:一丹一世界(下)2025 年 2 月 8 日副本: 是 AI 炼丹直播共学课第二节课。 比赛要求:参加由麦乐园和摩达社区发起的比赛,须用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 作图思路分享:分三步,明确创作主题即锚点,确定主体及联想角色设定,增加叙事感。 图片构成因素:包括构图、色彩以及光影。 构图介绍与分析:构图指在框架或空间内元素的摆放位置等,好的构图能引导观看者并创造和谐平衡。构图分类包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面)。构图要素有主体、陪体、前景、背景、点线面。构图方式如点中心构图、九宫格构图、三分法构图、对称构图、对角线构图、曲线构图、框架构图、三角形构图等。在 AI 绘图中,推荐中景及以上景别,全身景别可能需开 AD 跳以确保作图质量。 3. 字节 Trae Windows 版相关: 正式推出,免费。 为帮助大家使用 AI 编程实现想法,联合 AI 编程社会推出两个活动: AI 编程重磅直播:邀请在 AI 编程领域取得成绩的嘉宾深度交流,由黄叔亲自主持,还邀请了 Eric(Cubeone AI 创始人)等嘉宾。欢迎大家预约直播。 AI 编程训练营:WaytoAGI 和 AI 编程社推出为期 2 周左右的共学营,包含图文教程、视频、直播内容,社群内有老师答疑,完全免费。黄叔会在训练营里教大家做出多个 AI 应用。 Trae Windows 版本已上线,Mac 版本也可下载,官网地址:https://www.trae.ai/
2025-04-09
AI 视频编辑工具
以下是关于使用 AI 把小说做成视频的相关内容: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 相关工具与网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址: Stability AI 推出基于 Discord 的媒体生成和编辑工具,其功能包括: 1. 搜索和替换:无需蒙版,通过搜索提示识别对象并替换。 2. 创意放大:将低分辨率或低质量图像放大至 4K 分辨率,同时可以附加提示。 3. 外扩:在图像中添加内容以扩展空间,有全面、相当于 MJ 的 x2 以及上下左右单独扩展等五个选项。 4. 控制草图:将手绘草图转换为高质量图像,适用于设计项目。 5. Reuse as structure:保持输入图像结构,适用于高级内容创建。 6. 删除背景:准确分割前景并删除背景。 7. 视频:基于初始图像使用 Stable Video Diffusion 生成短视频。
2025-04-09
如何生成AI员工
生成 AI 员工可以参考以下步骤: 1. 生成设计方案:将需求抽象简化,分别用不同的 Prompt 生成多份设计方案进行对比。通过调整 Prompt 找到最优方案,避免限制 AI 的发挥空间。 2. 生成代码:确定方案后,完善细节,将完整设计交给 AI 生成代码。如果生成结果有问题,通过调整 Prompt 或更换模型反复优化。 像经理一样管理 AI“员工”,通过明确需求、方案对比、反复优化,提升代码质量与开发效率。 同时,结合“一人公司”的愿景,未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。创造者的学习也依照这个方向,用大模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。 在 Agent 工程(基础版)方面,如同传统的软件工程学,Agent 工程也有一个迭代的范式: 1. 梳理流程:梳理工作流程 SOP,并拆解成多个单一「任务」和多个「任务执行流程」。 2. 「任务」工具化:自动化每一个「任务」,形成一系列的小工具,让机器能完成每一个单一任务。 3. 建立规划:串联工具,基于 agent 框架让 bot 来规划「任务执行流程」。 4. 迭代优化:不停迭代优化「任务」工具和「任务执行流程」规划,造就能应对实际场景的 Agent。 此外,在从 AI 助教到智慧学伴的应用探索中,可从钉钉客户端创建 AI 助理,登录钉钉客户端后,在客户端右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理,进入创建 AI 助理页面后填写 AI 助理信息,设置完成后即可创建成功。
2025-04-09
有哪些生成精美图片的ai工具
以下是一些生成精美图片的 AI 工具: 1. 文生图工具: DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 MidJourney:因高质量图像生成效果和友好界面在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104 ),可以查看更多文生图工具。 2. 图生图工具: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:将上传照片转换为芭比风格,效果好。 此外,GPT4o 画图直接输入关键词即可生成精美图片,不需额外软件;带中文的图豆包生成图片效果也不错。但这些工具仍存在一些局限,如偶尔性能不稳定、生成内容不当等。
2025-04-09
AI写作
以下是关于 AI 写作的相关内容: 一、陈财猫的观点 作者陈财猫从自身经历出发,分享了以下关于用 AI 写出比人更好的文字的思考和实践: 1. AI+内容创作是现阶段最好的赛道:基于对大模型发展现状的观察和对“开车”“写作”两类任务的对比,认为该赛道有完美的产品模型匹配和产品市场匹配,且天花板高。 2. AI 写作的实践成果:业务包含营销和小说、短剧创作,开发了智能营销矩阵平台,参与喜马拉雅短故事和短剧写作课程,捣鼓出小财鼠程序版 agent。 3. 定义好文字:好文字能引起人的生理共鸣与情绪,AI 因预训练数据量大能学会引发共鸣,从而写出好文字。 4. 用 AI 写出好文字的方法: 选好模型,评估模型的文风和语言能力、是否有过度道德说教与正面描述趋势、in context learning 能力和遵循复杂指令的能力。 克服平庸,平衡“控制”与“松绑”。 显式归纳想要的文本特征,通过 prompt 中的描述与词语映射到预训练数据中的特定类型文本,往 prompt 里塞例子。 5. 对 AI 创作的看法:AI 创作的内容有灵魂,只要读者有灵魂,文本就有灵魂;有人讨厌 AI 是因其未改变多数人生活,或自身是受害者。作者期望 AI 能力进一步提升,改变每个人的生活。 二、3 月 10 日 AI 资讯中的相关内容 1. 【AI 写作】 Muse:专门为小说创作训练的 AI 模型工具,可实现在线的小说续写修改,创意头脑风暴以及同时基于画布形式的故事创作。可免费试用。 三、AI 写作变现指南 1. 项目启动: 确定目标客户群体,如大学生、职场人士、自媒体从业者等。 选择合适的 AI 写作工具,以满足不同客户的需求。 2. 准备阶段: 学习并实践 AI 写作技术,通过书籍、在线课程等资源提升写作技能。 构建团队,培养和扩充团队成员,以提高运营效率。 3. 商业模式构建: 确定服务内容,如提供论文、报告、文案等直接写作服务。 制定质量控制标准,确保写作内容满足客户要求。 4. 运营与推广: 在淘宝等电商平台上开设店铺,展示并销售写作服务。 建立写作培训社群,分享写作技巧和 AI 应用经验,提升品牌影响力。 通过社交媒体和线下活动进行品牌和社群建设。 与绘画团队、其他写作工作室等合作,共同开发新项目。 5. 项目优化与发展: 持续关注 AI 技术进展,提升服务质量和效率。 根据市场需求,拓展新的服务和产品。 收集客户反馈,不断优化和改进服务。 这份指导强调了 AI 技术在写作服务中的应用,以及如何通过团队建设、质量控制、客户反馈和市场拓展来提升整个业务的竞争力和盈利能力。同时,也提出了与艺术、自媒体等其他领域的合作可能性,以开发衍生项目,进一步扩大业务范围和市场份额。
2025-04-09
单独调用知识库
以下是关于知识库的相关内容: 创建并使用知识库: 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,包括最大召回数量(Bot 在调用知识库匹配用户输入内容时,返回的数据片段数量,数值越大返回的内容越多)、最小匹配度(Bot 在调用知识库匹配用户输入内容时,会将达到匹配度要求的数据片段进行召回。如果数据片段未达到最小匹配度,则不会被召回)、调用方式(自动调用:每轮对话将自动从所有关联的知识库中匹配数据并召回;按需调用:需要在人设与回复逻辑中提示 Bot 调用 RecallKnowledge 方法,以约束 Bot 在指定时机从知识库内匹配数据)。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 Coze 打造 AI 私人提效助理实战知识库: 在上述步骤中创建好知识库后,就可以在智能体中配置知识库了。在 coze 主页,个人空间 > 项目开发中,打开一个需要添加知识库的智能体,可以选择配置“文本”、“表格”、“照片”三种知识库。下面以配置文本知识库作为例子。点击加号,选择在 1.3 中已经提前创建好的知识库,点击添加。下一步就是配置提示词,让智能体自动使用知识库回答问题。在进行大概地描述以后,点击右上角“优化”,可以自动优化提示词,获得更好的结果。最后,在网页最右方的“预览与调试”中,测试智能体是否正常调用知识库。 集合 Deepseek 提示词方法论: DeepSeek R1 提示词系统完全指南: 三、进阶控制技巧: 1. 思维链引导:分步标记法(请逐步思考:1. 问题分析→2. 方案设计→3. 风险评估)、苏格拉底式追问(在得出最终结论前,请先列举三个可能存在的认知偏差)。 2. 知识库调用:领域限定指令(基于 2023 版中国药典,说明头孢类药物的配伍禁忌)、文献引用模式(以 Nature 2022 年发表的论文为参考,解释 CRISPR Cas9 最新突破)。 3. 多模态输出。 四、高级调试策略: 1. 模糊指令优化: 问题类型:宽泛需求,修正方案:添加维度约束,示例对比:原句:"写小说"→修正:"创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构"。 问题类型:主观表述,修正方案:量化标准,示例对比:原句:"写得专业些"→修正:"符合 IEEE 论文格式,包含 5 项以上行业数据引用"。 2. 迭代优化法: 1. 首轮生成:获取基础内容。 2. 特征强化:请加强第三段的技术细节描述。 3. 风格调整:改用学术会议报告语气,添加结论部分。 4. 最终校验:检查时间逻辑一致性,列出可能的事实性错误。
2025-04-09
知识库的批量创建和调用
以下是关于知识库的批量创建和调用的详细信息: 使用知识库: 在 Bot 内使用: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,包括最大召回数量、最小匹配度和调用方式(自动调用或按需调用)。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 创建知识库并上传表格数据: API 方式: 1. 在表格格式页签下,选择 API,然后单击下一步。 2. 单击新增 API。 3. 输入网址 URL 并选择数据的更新频率,然后单击下一步。 4. 输入单元名称或使用自动添加的名称,然后单击下一步。 5. 配置数据表信息后,单击下一步。 5.1 确认表结构:系统已默认获取了表头的列名,您可以自定义修改列名,或删除某一列名。 5.2 指定语义匹配字段:选择哪个字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。 6. 查看表结构和数据,确认无误后单击下一步。 7. 完成上传后,单击确定。 自定义方式: 1. 在表格格式页面下,选择自定义,然后单击下一步。 2. 输入单元名称。 3. 在表结构区域添加字段,单击增加字段添加多个字段。 4. 设置列名,并选择指定列字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。 5. 单击确定。 6. 单击创建分段,然后在弹出的页面输入字段值,然后单击保存。 创建文本型知识库: 目前支持 5 种导入类型:本地文档、在线数据、notion、飞书、自定义。 在线数据: 自动采集:支持从单个页面或批量从指定网站中导入内容。 添加单个页面的内容: 1. 添加方式:选择添加单个。 2. 更新频率:选择是否自动更新指定页面的内容及自动更新的频率。 3. 网址 URL:输入要采集内容的网址。 批量添加网页内容: 1. 添加方式:选择批量添加。 2. 根地址或网站地图:输入要批量添加的网页内容的根地址或 sitemap 地址,然后单击导入。 3. 导入成功后,单击确认。 手动采集:支持标注要采集的内容,内容上传成功率高。使用手动采集方式,需要先安装浏览器扩展程序。安装步骤,参考。 1. 在新增 URL 页面,选择手动采集。 2. 在弹出的页面输入要采集内容的网址,然后单击确认。 3. 在弹出的页面上,点击页面下方文本标注按钮,开始标注要提取的内容,然后单击文本框上方的文本或链接按钮。 4. 单击查看数据查看已采集的内容,确认无误后再点击完成并采集。
2025-04-09
deep seek辅助写论文
DeepSeek 在辅助写论文方面具有一定的优势和应用场景: 可以快速分析案例,为咨询策划报告提供效率赋能,通过结构化数据提取和逻辑推理,快速定位关键信息,生成具备商业洞察的初步框架。尤其在竞品分析、市场进入策略等场景中可缩短 30%以上的前期研究时间。 但也存在一些不足,例如写长文时可能会太发散、文风用力过猛导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 在使用 DeepSeek 辅助写论文时,可以参考以下建议: 先与 DeepSeek 讨论思路,获取初步的框架和要点。 对于生成的内容,根据需要进行修改和完善,以符合论文的要求和风格。 用户在使用 DeepSeek 辅助写论文的过程中,还可以尝试让其模仿特定的文风特征,或者通过多轮对话让其增删改查来调整字数。同时,也可以结合其他工具,如 Cloud 3.5 等,以提高论文的质量和效率。
2025-04-09
文生图
以下是关于文生图的详细教程: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型(麦橘写实、麦橘男团、墨幽人造人等)。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看帖子中使用的 lora。 ControlNet:用于控制图片中的特定图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,不用管语法,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图工具: 腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-04-09
200万字大模型
以下是关于大模型的相关信息: 4 月 6 日的 XiaoHu.AI 日报中提到:支持文本+图像+视频输入,采用 early fusion 技术整合多模态数据。Scout 支持 1000 万上下文,适合处理超长文本和复杂推理任务;Maverick 有 100 万上下文,长记忆优势适配多场景替代 RAG;Behemoth 是 2 万亿参数级别的大模型在训,已超越 GPT4.5 在 STEM 表现。相关详细介绍及评测的链接为: 。 在质朴发言:大模型未来发展:RAG vs 长文本,谁更胜一筹?|Z 沙龙第 8 期中提到:随着大模型上下文窗口长度不断增加,各个厂商对于文本生成模型呈现出“军备竞赛”的态势。目前,主流的文本生成模型是聊天模型,比如 GPT、Claude 3 等,也有少部分 Base 模型,例如 Yi34 开源模型。两位技术研究人员分享了他们对于大模型的看法:用户使用最多的是 GPT,但对外开放的版本性能较差,用户交互端无法传输大文件,只能通过 API 接口上传。月之暗面的 Kimi 模型大海捞针测试分数很高,但实际使用效果没有达到理想状态。百川 192K 的闭源模型,对于 6 万字的长文本,其表现的推理能力和回答效果很优秀。各种长文本的跑分数据,最高的是 Claude 3 模型。
2025-04-09