Navigate to WaytoAGI Wiki →
Home/All Questions
在ai图像训练打标时,怎么让部分标签权重更大
在 AI 图像训练打标时,让部分标签权重更大的方法如下: 1. 在 Stable Diffusion 中,手动补充的特殊 tag 放在第一位,因为 tags 标签有顺序,最开始的 tag 权重最大,越靠后的 tag 权重越小。 2. 在 BooruDatasetTagManager 中采用方法二: 删除部分特征标签,如 All tags 中不该出现的错误识别的自动标签,Image tags 中作为特定角色的自带特征的标签,并将特征与 LoRA 做绑定。 完成所有优化删除后,点击左上角菜单 File>Save all changes 保存当前的设置。 此外,在 Stable Diffusion 训练数据集制作中还需注意: 1. 调用 Waifu Diffusion v1.4 模型需要安装特定版本(2.10.0)的 Tensorflow 库,在命令行输入相应命令完成版本检查与安装适配。 2. 进入到 SDTrain/finetune/路径下,运行相应代码获得 tag 自动标注,其中主要参数包括: batch_size:每次传入 Waifu Diffusion v1.4 模型进行前向处理的数据数量。 model_dir:加载的本地 Waifu Diffusion v1.4 模型路径。 remove_underscore:开启后将输出 tag 关键词中的下划线替换为空格。 general_threshold:设置常规 tag 关键词的筛选置信度。 character_threshold:设置特定人物特征 tag 关键词的筛选置信度。 caption_extension:设置 tag 关键词标签的扩展名。 max_data_loader_n_workers:设置大于等于 2,加速数据处理。
2025-03-15
制作海报
以下是关于制作海报的相关内容: 离谱艺术展策划 主题:苍山离谱艺术展 形式:在大理苍山的松林间布置离谱植物和生物,每个生物都有 bot 交互,供大家寻找和交流。 参与方式: 大家一起共创。 建立投稿,投票选出排名靠前的创作。 捏 bot 小组。 文案和策展小组。 线下干活小组(找大理在地的同学一起参与和帮助)。 作品征集提交: 图片:分辨率建议不低于 1920x1080 像素(1080p),尺寸为 A4 尺寸(210mm x 297mm)或更大,便于制作海报。 人物小传:字数建议在 100200 字之间,简明扼要地介绍创作者或作品背景。 Bot 捏制:使用 Coze 或其他大型模型构建 AI 聊天框,确保与作品主题相匹配。 网站建设:在社群接龙小伙伴中寻找合适的人选,大聪明提供网站模板,简化建设流程。 海报制作:在海报上加入离谱村的标志和二维码,考虑将二维码单独打印,以便于更新和替换。 配合周边物料:补充宣传海报等周边物料,增强宣传效果。 寻找场地:在苍山山林间寻找合适的展览场地,考虑空间大小、交通便利性等因素。 用 AI 快速做一张满意的海报 需求场景:当想发条朋友圈/微博/twitter 等,干巴巴的文字不易获赞;百度图片的图质量差且易撞图;相册里的照片尴尬等情况。 大致流程: 主题与文案:确定海报主题后,可借助 ChatGPT 等文本类 AI 工具协助完成文案。 风格与布局:选择想要完成的风格意向,背景不一定是空白的,可根据文案和风格灵活调整画面布局。 生成与筛选:使用无界 AI,输入关键词,生成并挑选一张满意的海报底图。 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 母亲节海报制作解析 步骤拆解:分为背景、红色标注的三个图层以及文字部分。 背景制作:粉色渐变背景,使用 MJ 制作,提示词如“Closeup of a pink soft blob shape against a blurred background in pastel colors with gentle light in a high resolution,hyper realistic style.ar 9:16”等。康乃馨、粘土母子使用 MJ 制作,PS 或美图秀秀抠图。有了上述三个素材,在 PS 中简单排列,使用渐变工具在图片右下角加一个粉色到透明的渐变。 前景制作:使用字体工具加上中文和英文,使用形状工具画上爱心;使用文字工具在画面左侧加上文字,使用白色到透明渐变填充;使用文字工具给画面加上装饰文字;若觉得康乃馨喧宾夺主可删除,以母子作为画面核心,多一些留白效果更好。
2025-03-15
AI应用总汇
以下是 AI 的一些应用场景: 1. 辅助创作与学习: AI 智能写作助手帮助用户快速生成高质量文本。 AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等为用户的学习和创作提供支持。 2. 推荐与规划: AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等,根据用户的需求和偏好为其推荐合适的产品、服务或制定个性化的计划。 3. 监控与预警: AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等,实时监测各种情况并提供预警。 4. 优化与管理: 办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等,提高工作效率和管理水平。 5. 销售与交易: AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等,为各类产品和服务提供销售渠道。 在具体的行业应用中: 1. 医疗保健: 医学影像分析:AI 用于分析医学图像,辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新治疗方法。 个性化医疗:分析患者数据,提供个性化治疗方案。 机器人辅助手术:控制手术机器人,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:识别和阻止欺诈行为,降低金融机构风险。 信用评估:评估借款人信用风险,帮助做出贷款决策。 投资分析:分析市场数据,辅助投资决策。 客户服务:提供 24/7 服务,回答常见问题。 3. 零售和电子商务: 产品推荐:分析客户数据,推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果,提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 4. 制造业: 预测性维护:预测机器故障,避免停机。 质量控制:检测产品缺陷,提高产品质量。 供应链管理:优化供应链,提高效率和降低成本。 机器人自动化:控制工业机器人,提高生产效率。 5. 交通运输:(此处未提供具体应用内容)
2025-03-15
最好用的AI应用有哪些
以下是一些好用的 AI 应用: 1. AI 摄影参数调整助手:使用图像识别和数据分析技术,常见于摄影 APP 中,可根据场景自动调整摄影参数,市场规模达数亿美元。 2. AI 音乐情感分析平台:运用机器学习和音频处理技术,有音乐情感分析软件,能分析音乐的情感表达,市场规模达数亿美元。 3. AI 家居智能照明系统:基于物联网技术和机器学习,如小米智能照明系统,实现家居照明的智能化控制,市场规模达数十亿美元。 4. AI 金融风险预警平台:借助数据分析和机器学习,有金融风险预警软件,可提前预警金融风险,市场规模达数十亿美元。 5. AI 旅游路线优化平台:通过数据分析和自然语言处理,马蜂窝有路线优化功能,能根据用户需求优化旅游路线,市场规模达数亿美元。 6. AI 游戏道具推荐系统:利用数据分析和机器学习,常见于游戏内商城推荐功能,可根据玩家需求推荐游戏道具,市场规模达数亿美元。 7. AI 天气预报分时服务:采用数据分析和机器学习,如彩云天气分时预报,提供精准的分时天气预报,市场规模达数亿美元。 8. AI 医疗病历分析平台:依靠数据分析和自然语言处理,医渡云有病历分析系统,能分析医疗病历,辅助诊断,市场规模达数十亿美元。 9. AI 会议发言总结工具:使用自然语言处理和机器学习,讯飞听见有会议总结功能,可自动总结会议发言内容,市场规模达数亿美元。 10. AI 书法作品临摹辅助工具:借助图像识别和数据分析,有书法临摹软件,能帮助书法爱好者进行临摹,市场规模达数亿美元。 11. AI 菜谱口味调整工具:运用自然语言处理和数据分析,如下厨房口味调整功能,可根据用户反馈调整菜谱口味,市场规模达数亿美元。 12. AI 语言学习纠错平台:通过自然语言处理和机器学习,英语流利说有纠错功能,能帮助语言学习者纠正错误,市场规模达数十亿美元。 13. AI 电影剧情分析系统:利用数据分析和自然语言处理,豆瓣电影有剧情分析工具,能分析电影剧情,提供深度解读,市场规模达数亿美元。 14. AI 办公文件分类系统:凭借数据分析和机器学习,腾讯文档有分类功能,可自动分类办公文件,方便管理,市场规模达数亿美元。 15. AI 美容护肤方案定制平台:基于图像识别和数据分析,美丽修行有定制方案功能,能根据用户肤质定制护肤方案,市场规模达数亿美元。
2025-03-15
请列出目前最好用的AI应用提示词
以下是一些目前较好用的 AI 应用提示词: 1. 让 Claude 3.5 摆脱循环的提示技巧:在模型陷入重复或逻辑僵局时,使用提示词让其先进行多步、多角度思考,输出十段左右分析,再转化为代码实现。优势在于避免错误方向的持续生成,促使模型输出新的思考过程。注意如果模型输出内容已过于冗杂,建议修改原始提示词。参考链接: 2. AI 对程序员工作的影响分析:AI 可代替的部分包括代码生成、补全、分析问题和数据提取、辅助架构设计文档等;AI 无法代替的部分有需求分析、复杂项目拆分、线上问题排查、调试及安全性保障。建议专业程序员通过 AI 提升效率,但非专业人士难以依赖 AI 完成复杂任务,需注重自身技能提升和架构设计能力。参考链接: 3. AI 应用场景中的访谈内容真实性分析:从“自相矛盾”“时间线”“常识性冲突”角度,分析访谈内容的内部一致性,并结合常识推测可能存在夸大或不实之处。应用价值在于适合验证新闻、访谈或声明的真实性,发现潜在问题。参考链接: 此外,在 Apple Intelligence 中,如“有用的邮件助理”AI 机器人被指示如何根据邮件内容提出一系列问题,还包括“请将答案限制在 50 个单词以内。不要产生或编造虚假信息。”等提示。 在通往 AGI 之路知识库中,也有众多与提示词相关的内容,如之前社区测试中有关夫妻相的有趣提示词测试,还有 midjourney 提示词、股市卡片、解压缩等众多内容。此外有最佳实践、方法论、论文精读,提到刘海写伪提示词等技巧,吴文达老师讲 prompt 较好,还有 open i 官方提示,博主列出的 6 大策略吃透有助于写提示词。
2025-03-15
有什么可以修音的ai软件
以下是一些可以修音的 AI 软件及相关信息: 在音乐学习中,对于自定义前奏的工作流,可使用相关软件进行操作。如将 Midi 导出到 MP3 虚拟演奏文件,320kbit 码率是各大音乐平台的门槛,后期若想输出到 QQ 音乐之类需转码。修改音色方面,有很多染色软件可用,如 Neutron4,可从 Youtube 下载喜欢的乐器音色并用宿主软件打开插件导入音频实现渲染。 格林提到,利用 UDIO 的 REMIX 功能进行音质改造时,AI 会参考音频文件中的所有声音细节包括噪音。在上传音频给 UDIO 进行 REMIX 前,可使用传统音频处理手段如 WAVES 的 XNOISE 插件、RX11 音频修复软件以及 Audition 的采样降噪功能等进行降噪和去杂音处理。 在基于 Sovits 的声音训练及推理中,去混响可通过调整增加减少和伪影平滑的数值来实现,以耳朵感受为准。去杂音方面,对于非主人公声音,可根据情况选择静音或使用 ripx 软件精修。该软件交互体验优秀,将声音处理为 wav 格式。
2025-03-15
Amper Music 网站
Amper Music 是一个被 Shutterstock 收购的人工智能音频初创公司,为内容创作者提供 AI 音乐创作工具。其特点是不需要深入的音乐理论或作曲知识即可使用,能根据预先录制的样本创建音乐曲目,并可将其转换为真实音频,还能使用音乐键、速度、个别乐器等进行修改。您可以通过以下链接了解更多:https://www.ampermusic.com/ 此外,在人工智能音频初创公司方面,还有如 Microphone Studio(https://microphonestudio.app/)、TuneFlow(https://tuneflow.com/)、CassetteAI(https://cassetteai.com/)、AIVA(https://www.aiva.ai/)、beatoven.ai(https://www.beatoven.ai/)、Infinite Album(https://www.infinitealbum.io/)、Epidemic Sound(https://www.epidemicsound.com/)、WonderDynascore(https://www.wonder.inc/)、mayk.it(https://www.mayk.it/)、boomy(https://boomy.com/)、enote(https://enote.com/)等。在 AI 语音合成方面,还有如 AIVA(https://www.aiva.ai/)、Soundful(https://soundful.com/)等产品。在音乐风格方面,有 Aleatory、Ambient、Ambulatory、Amp、Amplified 等多种风格,每种风格都有其定义、描述、典型使用、示例和关联流派。
2025-03-15
写长论文的ai
在论文写作领域,AI 技术的应用发展迅速,为写作者提供了多方面的辅助。以下是一些常用的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,可提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,利于数据分析和可视化。 Knitro:用于数学建模和优化的软件,有助于复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽不是纯粹的 AI 工具,但结合自动化和模板,能高效处理格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 此外,橙篇是百度文库于 2024 年 5 月 30 日发布的综合性 AI Native 产品,集专业知识检索和问答、超长图文理解和生成、深度编辑和整理、跨模态自由创作等功能于一身,能满足科研、学术等领域的查阅、创作、编辑等全链路需求,包括长文写作、资料搜索、全文校正、格式整理、文档总结、查重、生成参考文献、翻译等。 从认知科学角度看,长文本处理是人类高级智力的体现,处理长文本信息需要在大脑中维护宏大上下文并进行复杂认知活动。对语言模型而言,长文本建模能力意味着更强的抽象和归纳能力。RAG 通过检索相关片段辅助生成,一定程度上弥补语言模型在长文本建模上的不足,提供即时获取背景知识的机制,但不能取代模型本身的语言理解和推理能力。例如微软的 Task Weaver 框架用于代码生成,将复杂任务拆分并用代码交互,若长文本技术发展提升,Agent 上限可能提高。使用这些 AI 工具时,应结合自身写作风格和需求选择合适的辅助工具。
2025-03-15
今天的AI新闻
以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总: 3 月 4 日: 【AI 3D】 Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。 InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。 3DMem:新型 3D 场景记忆框架。 【AI 绘图】 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。 海螺:推出 Image01 多功能文本转图像模型。 【AI 视频】 Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。 Vidu:API 开放平台全面开放。 【AI 模型】 Google Colab:推出 Data Science Agent。 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。 Opera:宣布推出网页浏览器的 AI 代理。 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。
2025-03-15
如何用AI修过曝的图片
以下是一些用 AI 修复过曝图片的方法和相关工具: 1. 使用 MutiDiffusion 插件:不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 2. 辅助工具: 视频放大:https://www.topazlabs.com/topazvideoai 百度网盘分享的 Topaz 全家桶:链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 提取码:16d1 Kraken.io:主要用于图像压缩,也提供免费图像放大功能,能保证图像细节清晰度。 Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术放大图像并赋予艺术效果,支持多种滤镜和风格。 RealESRGAN:基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次要收费。 Photoshop Generative AI 功能:主要工具包括 Remove tool、Clone brush、Generative fill 以及 Neural filters。 SD 图生图,重绘幅度小一点。 3. 【SD】超清无损放大器 StableSR: 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。 StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 在处理过曝图片时,可根据具体情况选择合适的方法和工具。例如,对于复杂的照片,可先在 PS 里进行角度调整和照片裁切,然后使用上述工具和方法进行处理。对于场景方向的指定,可给简单的关键词让 AI 自行决定,避免过多颜色提示词导致画面污染。
2025-03-15