Navigate to WaytoAGI Wiki →
Home/All Questions
文生图
以下是关于文生图的详细教程: 定主题:确定您想要生成的图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型(麦橘写实、麦橘男团、墨幽人造人等)。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看帖子中使用的 lora。 ControlNet:可控制图片中特定图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 采样算法:一般选 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图模型: 腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-03-10
comfyui教程
以下是一些关于 ComfyUI 的学习教程资源: 1. ComfyUI 官方文档:提供使用手册和安装指南,适合初学者和有经验的用户,可在获取相关信息。 2. 优设网:有详细的 ComfyUI 入门教程,适合初学者,介绍了特点、安装方法及生成图像等内容,教程地址是。 3. 知乎:有用户分享了 ComfyUI 的部署教程和使用说明,适合有一定基础并希望进一步了解的用户,可在找到相关教程。 4. Bilibili:提供了一系列涵盖从新手入门到精通各个阶段的视频教程,可在找到。 此外,还有以下教程: 1. 一个全面的 ComfyUI 教程:https://www.comflowy.com/zhCN 2. 超有意思的 ComfyUI 教程:https://comfyanonymous.github.io/ComfyUI_tutorial_vn/ ComfyUI 基础教程中 KSampler 相关内容: KSampler 即采样器,包含以下参数: 1. seed:随机种子,用于控制潜空间的初始噪声,若要重复生成相同图片,需种子和 Prompt 相同。 2. control_after_generate:设置每次生成完图片后 seed 数字的变化规则,有 randomize(随机)、increment(递增 1)、decrement(递减 1)、fixed(固定)。 3. step:采样的步数,一般步数越大效果越好,但与使用的模型和采样器有关。 4. cfg:值一般设置在 6 8 之间较好。 5. sampler_name:可通过此设置采样器算法。 6. scheduler:控制每个步骤中去噪的过程,可选择不同的调度算法。 7. denoise:表示要增加的初始噪声,文生图一般默认设置成 1。 内容由 AI 大模型生成,请仔细甄别。
2025-03-10
文生图
以下是关于文生图的简易上手教程: Tusiart 操作流程: 1. 定主题:明确要生成的图片的主题、风格和表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:可控制图片中特定的图像,如人物姿态、生成特定文字等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 即可。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 8. 负向提示词 Negative Prompt:同样用英文单词和短语组合,隔开方式相同,表达要避免生成的内容。 9. 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 次之间,多了慢且意义不大,少了效果差。 11. 尺寸:根据个人喜好和需求选择。 Liblibai 操作流程: 1. 定主题:确定生成图片的主题、风格和信息。 2. 选择 Checkpoint:按照主题找贴近的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:基于生成内容选择重叠的 lora 控制图片效果和质量。 4. 设置 VAE:选 840000 。 5. CLIP 跳过层:设为 2 。 6. Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开,不管语法和长句。 7. 负向提示词 Negative Prompt:用英文单词和短语组合,隔开方式相同,表达避免生成的内容。 8. 采样方法:一般选 DPM++2M Karras,参考模型作者推荐的采样器更有保障。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 步之间,多了慢且效果提升不大,少了效果差。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。 以下是一些文生图的提示词示例: 赛博哥特时尚摄影,风格化的身材瘦高细长的男性,类似《质量效应》中的生物机械两栖类星种植物外星怪物,身着全套赛博朋克街头服饰。机械天使手持超级等离子步枪,融合本・埃尔特、库尔特・帕普斯坦、亚历杭德罗・阿尔瓦雷斯的风格,色调为深海蓝色与靛蓝色,类似漫威漫画风格,带有幽灵般的形态,青蛙核风格,身形拉长,超写实细节,纤细,3D 雕刻感,石板灰、丁香色、奶油冰棒色、铜色、薄荷绿,极简主义,烟熏眼影,亮白色凸起的生物形态点状图案,发光的眼睛,发光的反向图案背景,色彩鲜艳,发光的未来主义赛博朋克盔甲与武器,变焦模糊,空灵的打光,逆光 常见的文生图工具包括:腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-03-10
有mp3转文字的东西吗
目前有多种工具和软件可以实现 MP3 转文字的功能。一些常见的包括: 1. 讯飞听见:具有较高的语音识别准确率。 2. 网易见外工作台:提供多种语言的语音转文字服务。 您可以根据自己的需求选择适合的工具。
2025-03-10
如果文生图
以下是关于文生图的详细指导: 1. 定主题:明确您想要生成的图片的主题、风格和表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果及质量。 4. ControlNet:可用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras 较多,也可留意 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:根据采样器特征,选 DPM++2M Karras 时,采样次数在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。 在提示词方面,Stable Diffusion 的生成方式主要分为文生图和图生图两种。文生图仅通过正反向词汇描述来发送指令。在文本描述上又分为两类:内容型提示词和标准化提示词。内容型提示词主要用于描述想要的画面,例如选择 anythingV5 这个专门用于二次元绘画的大模型,输入如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”等提示词(使用翻译软件翻译成英文)。采样迭代步数通常控制在 20 40 之间。采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++SDE Karras、DDIM 等,有的模型会有指定算法,搭配起来效果更好。比例设置为 800:400 ,注意尺寸并非越大越好,模型练图基本按 512x512 的框架去画,所以高宽比尽量在这个数值附近。 在提示词中,括号和“:1.2”等都是用来增加权重的,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时增加反向提示词,告诉 AI 不要的内容。
2025-03-10
用ai生成视频的工作流
用 AI 生成视频的工作流通常包括以下步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com (国内版:https://ai.midjourney9.com/?channel=0519116) 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 此外,还有一些其他工具,如用于 AI 作图的 ChatGPT4(https://openai.com/gpt4),用于 AI 生成音乐的 Suno(https://suno.com/),用于 AI 生成视频的 Runway(https://app.runwayml.com/)、PixVerse(https://www.pixverse.io/),以及用于视频后期剪辑的剪映电脑版。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-10
文本提炼
以下是对您提供的文本的提炼: 文本补全: 学习如何生成或操作文本。 完成端点可用于多样任务,提供简单强大接口连接模型。输入提示,模型生成补全,受任务复杂性和提示质量影响。 可通过 Playground 探索,API 输出非确定性,设置温度可调整。 本指南涵盖提示设计最佳实践,了解代码工作可访问代码指南。 Claude2 中文精读: 可执行多种文本处理任务,如摘要、编辑重写、情感识别、信息提取和删除、翻译等。 示例包括提取电子邮件地址、删除个人身份信息等。 提示工程关键原则: 原则 1 是编写清晰具体的指令,包括使用分隔符清楚限定输入不同部分,分隔符可以是多种明显标点符号,能避免提示注入。 策略 2 是要求结构化输出,如 HTML 或 JSON 格式,便于解析模型输出。
2025-03-10
有哪些视频风格转换工具
以下是一些常见的视频风格转换工具: 1. DomoAI 和艺映:上传 10 20 秒的视频即可完成视频的风格化转绘,但风格较为固定。 2. Ebsynth:可实现更可控、可操作的视频风格化转绘。 3. FRESCO:文字提示视频风格转换,无需额外训练即可编辑和转换视频风格,能保留视频动作和情节的自然流畅,并自适应屏幕尺寸。 4. HeyGen:发布 5.0 版本,整合了包括全新用户界面设计、引入视频编辑工作室和实时数字人聊天功能、视频翻译等功能。
2025-03-10
AI提示词怎么用
AI 提示词的使用方法如下: 1. 提示词用于描绘您想生成的画面。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 2. 写好提示词的要点: 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,例如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。也可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 写提示词(prompt)的建议: 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 提供上下文:任务需要特定背景知识时提供足够信息。 使用清晰语言:避免模糊或歧义词汇。 给出具体要求:明确格式或风格要求。 使用示例:提供期望结果的示例。 保持简洁:避免过多信息导致困惑。 使用关键词和标签:帮助 AI 理解任务主题和类型。 测试和调整:生成文本后检查结果并按需调整。 4. Prompt 支持的语言为英语(不用担心英语不好的问题,),emoji 也可以用。语法规则包括: 用英文半角符号逗号,来分隔 tag,逗号前后有空格或者换行不影响效果。 改变 tag 权重:tag 顺序越靠前对于 SD 来说权重越大,可通过括号,权重就重 1.1 倍,每加一层括号就反向减弱 1.1 倍)两种方式设置。 进行 tag 的步数控制(高级玩法):如,数字大于 1 理解为第 X 步前为 tag1,第 X 步后变成 tag2,数字小于 1 理解为总步数的百分之 X 前为 tag1,之后变成 tag2。
2025-03-10
行业分析
以下是关于 AI 行业分析的相关内容: GLM4AllTools 数据分析:这是专门为支持智能体和相关任务而进一步优化的模型版本。代码沙盒 Code Interpreter 工具很大程度加强了其数据计算能力,能处理日常的数据分析。在案例中,可对 2024 年上半年各行业企业统计数据做图表分析,包括收入数据可视化、利润数据可视化、计算利润率并排序等。 翻译:AI 行业分析:50 个访问量最大的 AI 工具及流量行为。原文地址为 https://writerbuddy.ai/blog/aiindustryanalysis,作者为 从列出 AI 工具的各种目录中抓取数据,分离出访问量最大的 50 个工具,旨在深入研究人工智能行业的行为,分析流量模式、人口统计、趋势和消费者行为。 生成式 AI 年终数据报告 2023 年:作者介绍大部分即时信息在推特;结构化信息,行业分析,沉淀在飞书 AIwatch.ai。左边是对赛道的一些定性观察,赛道分类不够精准,本报告没有写结论和单独分析优秀公司,更像一个赛道数据公共产品。报告引用了很多海外公司的图谱,版权归原作者所有。主要来自@cheifoffice 和 synaptic 公司,还有大量的 VC 图谱。欢迎转载,注明出处即可:Aiwatch.ai。时间范围为 211 月,数据标准来自 similarweb,单位是万 PV。包括赛道总体月 PV、TAM Total addressable Market 市场天花板、赛道流量分布情况、估值,收入相关情况等,5 月是流量的一个高点,可对比 11 月和 5 月的增减情况。
2025-03-10