Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

大批量自动抠图

Answer

以下是使用 ComfyUI 进行大批量自动抠图的详细步骤: 首先,创建工作流生成绿幕素材: 1. 加载默认文生图工作流,根据需要添加 lora 节点。 2. 准备一张绿幕背景图,RGB 为<0,255,0>,尺寸根据自己需要设置,例如 512*768(匹配 SD1.5 模型)。 3. 将 empty latent image 节点删掉,加载 load image 节点,上传绿幕图。 4. 右键点击 load image 节点,进入蒙版编辑器绘制蒙版,点击保存(蒙版画出主体大致轮廓即可,不用特别精细)。 5. 加载 vae encode for inpainting 节点,grow mask by 值适当高点。 6. 设置正反提示词部分,由于最终输出的图片包含“主体”和“绿幕背景”两个部分,所以需要两个正向提示词节点(clip text encode prompt),一个填写“主体”描述,一个填写“green background”。并使用 conditioning concat 节点进行串联后发送到采样器,反向提示词正常写,为了最终抠图效果,希望尽量避免出现绿色、阴影,把 green,shadow 加进去即可。 7. 最后连接好所有节点,选择好模型,设置采样器参数,跑图测试。 其次,绿幕素材抠图部分: 1. 加载 image select color 节点,左侧与上个部分的 vae deconde 节点相连,RGB 设置为<0,255,0>,容差(variance)尽量高一些,设置为 100。可以在右侧连上 preview image 节点预览,灵活调整容差值。 2. 把拾取颜色的图片转换为蒙版,添加 convert image to mask 节点,channel 设置为 green,左侧与 image select color 相连,右侧添加 mask ops 节点,主要设置 4 个参数:channel(通道)为 green,shrink_grow(收缩范围)为 3-10,invert(将蒙版从绿幕反转为主体,0 为不反转)为 1,blur_radius(羽化半径)为 0-2。shrink_grow 和 blur_radius 可以根据素材灵活调整。 3. 将 mask ops 节点右侧的 mask_image 连接 cut by mask 节点,将蒙版外的部分切除,最后 cut by mask 右侧连接 save image 节点。 4. 也可以 image select color 节点左侧替换为 load image 节点,上传任一张绿幕素材进行抠图。 工作流的迭代改进点包括: 1. 训练绿幕 lora,生成更纯净的绿幕素材。 2. 对非绿幕的正常图片进行抠图。
Content generated by AI large model, please carefully verify (powered by aily)

References

ComfyUI自动生成抠图素材

首先加载默认文生图工作流,根据需要添加lora节点我们要生成绿幕背景的素材,思路是:在绿幕上进行局部重绘准备一张绿幕背景图,RGB为<0,255,0>,尺寸根据自己需要设置,我设置为512*768(匹配SD1.5模型)将empty latent image节点删掉,加载load image节点,上传绿幕图右键点击load image节点,进入蒙版编辑器绘制蒙版,点击保存(蒙版画出主体大致轮廓即可,不用特别精细)然后我们要把绿幕和蒙版输入潜空间重绘,所以加载vae encode for inpainting节点,grow mask by值适当高点下面是正反提示词部分由于最终输出的图片包含“主体”和“绿幕背景”两个部分,所以我们需要两个正向提示词节点(clip text encode prompt),一个填写“主体”描述,一个填写“green background”。并使用conditioning concat节点进行串联后发送到采样器,这样可以对两部分语义进行分隔。反向提示词正常写,为了最终抠图效果,我们希望尽量避免出现绿色、阴影,把green,shadow加进去即可最后连接好所有节点,选择好模型,设置采样器参数跑图测试一下,完美你还可以用这个工作流来训练一个绿幕lora

ComfyUI自动生成抠图素材

我为什么学习使用ComfyUI:更接近SD的底层工作原理,在更靠近一朵鲜花的地方,才能闻到它的芳香自动化工作流(我也用webui,虽然很好,但我觉得ComfyUI更符合AI的精神,即消灭重复性工作)作为一个强大的可视化后端工具,可以实现SD之外的功能,如调用api及本文所讲的内容等可根据定制需求开发节点或模块Hi,大家好,我是金属文。我制作这个工作流的动机是:我的工作室经常需要一些抠图素材,用做海报、推文、短视频等用途传统的搜集抠图素材途径无非是网站下载、付费购买、自己PS。要么花钱,要么花时间,还不能根据自己的需求定制素材近期在github上看到一个名为[ComfyI2I](https://github.com/ManglerFTW/ComfyI2I)的项目,其中包含了丰富的蒙版处理节点于是我基于[ComfyI2I](https://github.com/ManglerFTW/ComfyI2I)创建了这个ComfyUI工作流,不仅可以用作绿幕素材的抠图,还可以自动生成定制需求的抠图素材,全程只需要几秒,太香了!先来看下效果:下面我将分享创建整个工作流的思路以及详细步骤讲解话不多说,开始干货教程

ComfyUI自动生成抠图素材

这个部分需要用到ComfyI2I的一些节点,思路是通过拾色器识别绿幕,为素材主体生成蒙版,再把绿幕切除掉,这样就得到了一张透明背景的png抠图素材。首先加载image select color节点,左侧与上个部分的vae deconde节点相连,RGB设置为<0,255,0>,容差(variance)尽量高一些,设置为100可以在右侧连上preview image节点预览,灵活调整容差值然后把拾取颜色的图片转换为蒙版,添加convert image to mask节点,channel设置为green,左侧与image select color相连,右侧添加mask ops节点,这是一个非常实用的蒙版处理工具,我们主要设置4个参数:channel(通道):greenshrink_grow(收缩范围):3-10invert(将蒙版从绿幕反转为主体,0为不反转):1blur_radius(羽化半径):0-2shrink_grow和blur_radius可以根据素材灵活调整然后我们将mask ops节点右侧的mask_image连接cut by mask节点,将蒙版外的部分切除,最后cut by mask右侧连接save image节点,就大功告成了!你也可以image select color节点左侧替换为load image节点,上传任一张绿幕素材进行抠图现在你可以搭配上个工作流,愉快的抽卡了!工作流迭代改进点:1.训练绿幕lora,生成更纯净的绿幕素材2.对非绿幕的正常图片进行抠图

Others are asking
能帮助处理大批量裁剪图片的软件有哪些?
以下是一款能够处理大批量裁剪图片的软件及相关操作: 在视频转绘制作视频过程中,Ebsynth Utility 是不可或缺的。当对关键帧的图片试验完毕得到满意画面需要进行批量跑图时,来到图生图界面点击最下面的脚本按钮,选择 Ebsynth Utility 这个脚本。有很多参数需要设置: 1. 必须填写对应的工程文件路径,此路径和之前在插件填写的路径一致。 2. Mask option 选项控制是否使用蒙版,若需要使用蒙版则维持默认参数,若不想使用蒙版就重绘所有画面,可调整相关参数。 3. ControlNet 配置可保持默认参数,感兴趣的小伙伴可自行尝试。 4. 脸部裁切配置默认关闭,开启后可改善面部崩坏情况。相关参数包括: Face Detection method:面部裁切选择(使用默认即可)。 Face Crop Resolution:面部裁切分辨率(一般给 512,可适当缩小或放大)。 Max Crop Size:最大裁切尺寸(保持默认)。 Face Denoising Strength:人脸去噪程度(若画面不清晰可稍微拉高)。 Face Area Magnification:面部放大倍数(设置越大处理越费时间)。 设置完所有参数后点击生成按钮,耐心等待,最后会在工程文件夹中生成一个 img2img_key 的文件夹。
2025-01-07
想了解关于数据标注的两个问题, 1-下国内数据标注需求的发展趋势,是否会大批量被Ai训练取代 2-国内有哪些需求基础数据标注需求的公司
数据标注是机器学习和人工智能领域的一个重要环节,尤其在训练监督学习模型时,需要大量的标注数据来训练模型。以下是对您提出的两个问题的回答: 1. 国内数据标注需求的发展趋势: 自动化和AI辅助:随着AI技术的发展,自动化标注工具和AI辅助标注工具正在变得越来越流行。这些工具可以减少人工标注的工作量,提高标注效率。 高质量数据需求:尽管自动化工具可以帮助标注,但它们通常需要人工审核和校正以确保数据质量。因此,对高质量、高精度标注的需求仍然很高。 特定领域和细分市场:随着AI应用的深入,特定领域(如医疗、法律、金融等)对定制化和专业化的数据标注需求会增加。 AI模型的迭代:AI模型需要不断地迭代和优化,这意味着即使是自动化标注,也需要定期更新和维护标注数据集。 2. 国内需求基础数据标注需求的公司: 百度:百度的AI开放平台提供了多种数据标注服务,支持语音、图像、文本等多种类型的数据标注。 阿里巴巴:阿里巴巴的达摩院在AI领域有深入的研究,其数据标注服务支持其AI技术的发展。 腾讯:腾讯的AI Lab同样需要大量的标注数据来训练和优化其AI模型。 字节跳动:字节跳动的推荐算法和内容审核系统需要大量的文本和图像数据标注。 除了上述大型科技公司外,还有许多专业的数据标注公司,如数据堂、龙猫数据等,它们为各种AI应用提供定制化的数据标注服务。 随着AI技术的进步,数据标注行业也在逐渐向更高质量、更专业化的方向发展。同时,数据隐私和安全也越来越受到重视,合规性成为数据标注服务的一个重要考量因素。
2024-04-17
如何自动生成文案
以下是几种自动生成文案的方法: 1. 基于其它博主开源的视频生成工作流进行优化: 功能:通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径:通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 生成有趣的《图文短句》: 实现原理: 先看工作流:包括第一个大模型生成标题、通过“代码节点”从多个标题中获取其中一个(可略过)、通过选出的标题生成简介、通过简介生成和标题生成文案、将文案进行归纳总结、将归纳总结后的文案描述传递给图像流。 再看图像流:包括提示词优化、典型的文生图。 最终的 Bot 制作以及预览和调试。 3. 腾讯运营使用 ChatGPT 生成文案: 步骤:通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,从而实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,系统匹配的素材不符合要求时可以手动替换。例如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类 AI 视频制作工具让普罗大众生产视频变得更轻松上手。
2025-04-15
需要做一个自动化出视频的工作流
以下是一个关于自动化出视频工作流的详细介绍: 优势: 全自动化处理,解放双手。 40 秒快速出片,效率提升。 成本低廉,每条仅需 0.0x 元。 输出质量稳定专业。 DeepseekR1 保证文案质量。 还能改进,例如可以加入配套 BGM,让视频更有感染力;增加更丰富的画面内容和转场效果;使用免费节点替代付费插件,进一步降低成本;优化模板样式,支持更多展示形式;增加自动化程度,支持批量处理。 工作流程: 1. 可以在扣子商店体验,建议自己搭建。 2. 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 3. 选择发布渠道,重点如飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 4. 创建飞书多维表格,添加相关字段,配置选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 5. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件,一键导出成品。但需注意节点产生的视频是异步生成,可能无法马上展现,需耐心等待几秒。 如果您还有其他疑问或需要进一步的帮助,请随时联系。
2025-04-14
运用ai,生成每日自动推送到飞书消息的 公司文化日报,包含日历 天气 新闻 内部规划 事项
要运用 AI 生成每日自动推送到飞书消息的公司文化日报,包含日历、天气、新闻、内部规划和事项,您可以考虑以下步骤: 首先,需要确定获取日历、天气、新闻、内部规划和事项等信息的数据源。对于日历,可以使用在线日历服务的 API 来获取相关数据;天气信息可以从专业的气象数据提供商获取;新闻可以通过新闻聚合 API 或者与特定的新闻机构合作获取;内部规划和事项则需要从公司内部的管理系统或数据库中提取。 然后,选择适合的 AI 技术和工具。例如,可以使用自然语言处理技术来对获取到的数据进行处理和整合,生成易于阅读和理解的文本内容。 在生成日报的过程中,要注意格式的规范和统一,使其具有良好的可读性。同时,可以根据公司的文化特点和需求,对内容进行个性化的定制和优化。 另外,为了确保推送的准确性和及时性,需要建立有效的监控和反馈机制,及时发现并解决可能出现的问题。 希望以上建议对您有所帮助。
2025-04-14
自动生成字幕
以下是关于自动生成字幕的相关信息: 苹果发布的 Final Cut Pro 11 具有自动生成字幕的功能,其特点是能够将语音转换为字幕,提高效率。 虽然 ChatGPT 本身无法直接总结 YouTube 视频,但有些免费服务可以帮助转录或下载视频的自动生成字幕。将得到的文字保存并上传,可让 ChatGPT 帮忙将 YouTube 视频的字幕转化为简洁的要点。
2025-04-14
Deepseek自动生成网站前端页面
以下是关于 DeepSeek 自动生成网站前端页面的相关内容: DeepSeek v3 能力更新后虽能生成炫目的前端页面,但多为静态且实用性有限。可结合飞书多维表格将生成的漂亮前端变为真实的系统,如【智能作业分发系统】。 该系统整体包括用户登陆(可加飞书调查表二维码实现注册)、作业类型、作业详情(含连连看游戏、AI 智能问答、考试系统)。其实现逻辑为用户登陆系统后进入页面看到老师分配的作业分类,选择分类进入作业详情页面,详情页有学习单词发音及三个模块。 对于小白,可用飞书作数据源,通过飞书 API 接口获取内容,用 DeepSeek v3 制作前端+后端(用 Trae 更方便)。获取请求参数时,测试成功后的示例代码中有完整的请求参数和请求体可直接复制使用。创建前后端时,若用 DeepSeek 官网搭建需按代码目录结构创建对应文件(用 Trae 可省略),首次运行可能遇到飞书 API 未正确配置 CORS 导致浏览器拦截请求的问题,V3 会给出修改意见。 此外,Same dev 能像素级复制任意 UI 界面并生成前端代码,支持多种文件格式和技术栈代码,但免费额度消耗快,网站被谷歌标记。360 智脑复现了 DeepSeek 强化学习效果并发布开源模型 LightR114BDS。 AI 时代生存法则:会提需求比会写代码更重要,会开脑洞比会复制粘贴更值钱,真正的大佬都是让 AI 当乙方!
2025-04-13
如何通过提交的pdf文件自动生成流程图。
目前在 AI 领域,直接通过提交的 PDF 文件自动生成流程图还存在一定的技术挑战。通常情况下,需要先将 PDF 文件中的内容进行解析和提取,然后利用专门的流程设计工具或软件来手动创建流程图。但随着技术的不断发展,未来可能会有更便捷和高效的方法来实现这一功能。
2025-04-13