Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频,如何做,几个步骤

Answer

以下是生成有一定操控能力的风格化、动漫风生成式短视频的步骤:

  1. 项目规划:确定短视频的主题和目标观众,制定详细的制作计划。
  2. 剧本创作:编写故事脚本,设计角色和场景以及创意。可参考相关剧本创作资料,如:https://waytoagi.feishu.cn/wiki/G11fwW8bmiVLe6kYLgYc2iGin6e ;捏剧本 Bot(捏剧本-离谱村专用 https://www.coze.cn/store/bot/7367669913697239052?panel=1&bid=6cs144r404016 。
  3. 分镜头脚本:根据脚本制作分镜头脚本,确定每个镜头的画面和动作。
  4. 资源准备:准备动画制作所需的素材,包括背景、角色和音效。
  5. 画面图片制作:利用 AI 出图工具,比如通过 ChatGPT、MJ、SD 等工具快速生成高质量的图片。
  6. 视频制作:利用 AI 工具制作动画,通过 RUNWAY、Luma、Dreamina 等平台快速生成高质量的动画。
  7. 后期剪辑:添加音效、配音和字幕,进行最终的剪辑和合成。
  8. 发布和推广:将完成的动画短片发布到各大平台,并进行推广和宣传。

此外,在实际制作中,还可以参考一些成功案例,如山西文旅宣传片的制作,运用 Defense 及 SD 制作黄河长城等 AI 艺术字;为陕西文旅做的 40 秒黑神话悟空风格 AI 短片,用 SD 结合 Control Lite 处理钟楼等。郑州 AI 文旅片工作流总体分为分镜脚本、单帧图片制作、图片细节修复与生成视频、视频风格化处理、剪辑合成五个步骤。

Content generated by AI large model, please carefully verify (powered by aily)

References

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄全真AI虚拟人成熟:包含感情的AI NPC成熟,开放世界游戏成熟;游戏中几乎无法区别真人和NPCAR/VR技术大规模商用接近AGI的技术出现人与AI配合的工作方式成为常态,很多日常决策开始由AI来执行AI生产的数据量超过全人类生产数据量,“真实”成为稀缺资源具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破“人的模型”出现,出现“集中化AGI”与“个人AGI”的历史分叉AI引发的社会问题开始加重,结构性失业开始出现AGI对于地缘政治的影响开始显露……"Limit of Understanding"; Yifei Gong 2024,with Dall-E

SOP+AI:作为小白,我是如何参与制作AI动画短片的?

这是一篇迟到的文章,最近有点忙,但是后台看到支持我的小伙伴越来越多,再忙也要坚持写作?,今天分享下设计小白怎么借助AI制作视频短片。5月份我参与制作的AI动画短片《奥运前夜》6.1在广州电视台播放了?。作为一个设计小白,同时还定居在广州,我感到非常自豪?。短片链接如下?:[heading2]01[content]在此首先特别感谢共创活动组织者「AJ、娜娜、猫叔、三思、王贝等」,以及5组组长「阿强」的指导和帮助,通过这次共创过程,我也收获了很多宝贵的经验。其次,我要特别提到SOP(标准操作程序)和工作流的重要性,它们是确保项目顺利进行的关键。分享AI动画短片制作的SOP流程如下(部分内容来源于Waytoagi AI视频资料分享):1、项目规划:确定短片主题和目标观众,制定详细的制作计划。2、剧本创作:编写故事脚本,设计角色和场景以及创意。分享剧本创作资料如下:https://waytoagi.feishu.cn/wiki/G11fwW8bmiVLe6kYLgYc2iGin6e捏剧本Bot(捏剧本-离谱村专用https://www.coze.cn/store/bot/7367669913697239052?panel=1&bid=6cs144r4040163、分镜头脚本:根据脚本制作分镜头脚本,确定每个镜头的画面和动作。4、资源准备:准备动画制作所需的素材,包括背景、角色和音效。5、画面图片制作:利用AI出图工具,比如通过ChatGPT、MJ、SD等工具快速生成高质量的图片。6、视频制作:利用AI工具制作动画,通过RUNWAY、Luma、Dreamina等平台快速生成高质量的动画。7、后期剪辑:添加音效、配音和字幕,进行最终的剪辑和合成。8、发布和推广:将完成的动画短片发布到各大平台,并进行推广和宣传。

第一课回放:AI文旅视频共学-WaytoAGI 2024年9月5日

[heading2]总结AIGC在文旅及其他领域的视频应用与制作流程山西文旅宣传片制作:运用Defense及SD制作黄河长城等AI艺术字,先在PS中做简单字体,在SD中跑图,再用PS加入地标性建筑后反复跑图以提高画面完整度,全片未用实拍素材。部分片子的实拍情况:荷兰相关片子中戏剧部分因时间紧用实拍片段,后对戏剧进行风格化处理。陕西片子后续会展示全流程剖析。快餐式AI短片成果:为陕西文旅做的40秒黑神话悟空风格AI短片,仅用两天,用SD结合Control Lite,对钟楼等进行处理,主要靠多次抽卡图片。各类AI文旅片及其他项目:为江西、台湾、贵阳等地做文旅片,为江苏电视总台、广州卫视少儿科创、中国平安等做相关创意短片。郑州AI文旅片工作流:总体分为分镜脚本、单帧图片制作、图片细节修复与生成视频、视频风格化处理、剪辑合成五个步骤。脚本创作以天地之中概念讲述郑州历史与新时代文旅发展,分了解郑州的三个篇章。

Others are asking
风格化mj提示词
以下是关于 Midjourney 风格化提示词的相关内容: 仿照 GPTs 里的 MJ prompt 改的提示词可用于 coze 或其他国内的 agent。MJ 对节点无要求,画插图可不切节点,不挑模型,提示词可让 agent 补全润色。例如:“一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格”的提示词为“A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6”。 Midjourney V6 更新风格参考命令 2.0“sref”,常见问题如想要的新图像和 sref 图像差异大时,MJ 给出了三种办法: 修改提示:语义细节太多时,编写提示用可取细节替换不需要的;风格不够时,修改提示使其更符合追求的风格。 更改“sw”值:语义细节太多时,将“sw”从默认值 100 降低;风格不够时,将“sw”从默认值 100 提高。 使用小权重强调或弱化不需要的画布元素。 参数总览与举例: “No 否定提示”:在提示词末尾加上“no”可让画面中不出现某些内容,如“no plants”表示图像中不出现植物。 “Quality 生成质量”:在提示词后加上“quality”或“q”参数可更改生成图像花费时间和质量,高质量需更长处理时间和更多 GPU 分钟数。 “Seeds 种子值”:MJ 依靠噪点团起点“Seed”创建视觉噪音场生成初始图像,每个图像种子值随机生成,可指定,v4 模型中相同种子值和提示词产生相同图像结果,可用于生成连贯一致的人物形象或场景。 “Stylize 风格化”:使用 stylize 参数可让 Midjourney 生成更具艺术色彩、构图和形式的图像,低风格化值生成的图像与提示密切相关但艺术性较差,高风格化值产生的图像艺术性强但与提示关联性少,AI 自由发挥空间大。
2025-04-11
请你作为AI设计师,为我推荐好用的AI风格化工具,可以进行批量处理图片,与此同时保持高度的风格统一
以下为您推荐一些好用的可批量处理图片并保持高度风格统一的 AI 风格化工具: 1. 星流一站式 AI 设计工具: 基础风格模型 Checkpoint:包含多个分类不同风格的大模型,适用于写实摄影、插画、动漫、3D 立体等,能生成丰富多彩的图片效果。其中星流通用大模型相比常见大模型具有更强的语义理解、更高的艺术审美和表现力。基础模型 F.1、基础模型 XL、基础模型 1.5 在效果和生成速度上有所不同,效果上基础模型 F.1>基础模型 XL>基础模型 1.5,生成速度上基础模型 1.5>基础模型 XL>基础模型 F.1。入门模式下只能使用星流通用大模型。 增强模型:作为基础模型的补充,用于生成特定风格、角色。您可以收藏模型、查看例图,还可以通过滑动鼠标到图像并点击风格,将当前风格当作增强模型使用。 2. Magnific AI:具有新功能——风格转换,可以将任意照片转换成各种风格的图像,同时保持人物对象的一致性。大 BOSS 的演示和教程下周开放访问。 3. Cartwheel:文本转 3D 动画工具,输入文字提示即可生成适用于多种用途的 3D 动画角色,支持指定动作,可以导出到任何 3D 程序中编辑。目前处于早期阶段,还在测试阶段,需排队。
2025-03-27
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频
目前关于通过 AGI 生成有一定操控能力的风格化、动漫风生成式短视频,以下是一些相关信息: 2024 年内,有一定操控能力的生成式短视频中,风格化、动漫风最先成熟,真人稍晚。 同时,在 2024 年还会有其他相关进展,如 AI 音频能力长足进展,带感情的 AI 配音基本成熟;“全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货;游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式;AI 男/女朋友聊天基本成熟,记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈;实时生成的内容开始在社交媒体内容、广告中出现;AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验;AI 的商业模式开始有明确用例,如数据合成、工程平台、模型安全等;可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功;中国 AI 达到或超过 GPT4 水平,美国出现 GPT5,世界上开始现“主权 AI”;华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚);AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧;AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年,AI 3D 技术、物理规则成熟,正常人无法区别 AI 生成还是实景拍摄;全真 AI 虚拟人成熟,包含感情的 AI NPC 成熟,开放世界游戏成熟,游戏中几乎无法区别真人和 NPC;AR/VR 技术大规模商用;接近 AGI 的技术出现;人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行;AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源;具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破;“人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉;AI 引发的社会问题开始加重,结构性失业开始出现;AGI 对于地缘政治的影响开始显露。
2024-12-09
我想用AI工具将照片风格化,提供现实照片后,生成元宇宙风格的图片,有哪些工具可以达成效果?
目前市面上有一些可以将照片风格化为元宇宙风格的 AI 工具,例如: 1. DALL·E2:能够根据输入的描述或原始图片生成富有创意和独特风格的图像。 2. StableDiffusion:具有强大的图像生成能力,可以通过设置相关参数和提示来实现照片的风格化。 3. Midjourney:可以根据输入的指令生成令人惊艳的图像效果,包括将照片转化为特定风格。 您可以根据自己的需求和使用习惯选择适合的工具。
2024-10-08
有AI绘画的风格化提示词吗,最好是英文加中文的,并且只要风格类的
以下是一些 AI 绘画的风格提示词,包括英文和中文: Trending on artsationA 站趋势风格 surrealism 超现实风格 oil painting 油画风格 Original 原画风格 Cyberpunk 赛博朋克风格 postimpressionism 后印象主义风格 Wasteland Punk 废土风格 digitally engraved 数字雕刻风格 architectural design 建筑设计风格 poster style 海报风格 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyoe 浮世绘 Manga style 日本漫画风格 stock illustration style 童话故事书插图风格 CGSociety 梦工厂动画风格 DreamWorks Pictures 梦工厂影业 Pixar 皮克斯 Fashion 时尚 poster of Japanese graphic design 日本海报风格 90s video game 90 年代电视游戏 french art 法国艺术 Bauhaus 包豪斯 Anime 日本动画片 卜绘 and Pixel Art 像素画 Vintage 古典风,1819 世纪 Pulp Noir 黑白电影时期 Country style 乡村风格 Abstract 抽象风 risograph iso 印刷风 Graphic 设计风 ink render 墨水渲染 Ethnic Art 民族艺术 retro dark vintage 复古黑暗 Tradition Chinese Ink Painting style 国风 Steampunk 蒸汽朋克 film photography 电影摄影风格 concept art 概念艺术 montage 剪辑 full details 充满细节 Gothic gloomy 哥特式黑暗 realism 写实主义 black and white 黑白 Unity Creations 统一创作 Baroque 巴洛克时期 Impressionism 印象派 Art Nouveau 新艺术风格 Rococo 新艺术 Renaissance 文艺复兴 Fauvism 野兽派 Cubism 立体派 Abstract Art 抽象表现主义 OP Art/Optical Art 欧普艺术/光效应艺术 Victorian 维多利亚时代 futuristic 未来主义 Minimalist 极简主义 brutalist 粗犷主义 Constructivist 建构主义 botw 旷野之息 Warframe 星际战甲 Pokemon 至可梦 APEX Apex 英雄 The Elder Scrolls 上古卷轴 From Software 魂系游戏 Detroit:Become Human 底特律:变人 AFK Arena 剑与远征 cookierun kingdom 早刃百跑跑姜饼人 League of legends 英雄联盟 jojo's bizarre adventure Jolo 的奇妙冒险 gothic 哥特式 Ukiyoe 日本浮世绘风格 Traditional Chinese painting 中国国画 coil painting 油画 realism 现实主义 film noir 黑暗风格 water colour painting 水彩画 Romanticism 浪漫主义 Renaissance Art 文艺复兴风格 Neoclassicism 古典主义 academic art 学院派 hyperrealism 写实主义 Japonism 日式风格 Baroque 巴洛克式 folk art 民间艺术 ink painting 水墨画 ancient Egypt 古埃及 manuscript 手稿 Academicism 学院主义 Miserablism 愁苦主义 Ancient Greek art 古希腊艺术 Disney style 迪士尼风格 Picos style 皮克斯风格 illustration 插画风格 Japanese manga style 日本漫画风格 digital illustration 数字插画 dark fantasy style 黑暗幻想风格 Pop art 波普艺术 impressionism 印象派 Neoimpressionism 后印象派 fauvism 野兽派 expressionism 表现主义 abstract expressionism 抽象表现主义 cubism 立体主义 contemporary art 当代艺术 anime style 动画风格 cartoon 卡通 visionary art 视觉艺术 comic book 漫画书 streampunk 蒸汽朋克 dark theme 黑暗主题 miniature model film 微缩模型电影 DC Comics 能生成美漫封面的漫画画面 pixiv 纯二次元风格人像 style ofAl Williamson 威廉森风格 Bauhaus Style 包豪斯风格 Warhol 安迪·沃霍尔风格 Luminsm 光色主义 Magic Realism 魔幻现实主义 Fantastic Realism 魔幻现实主义 Classical Realism 批判现实主义 Pixel art 像素艺术 Contemporary Realism 当代写实主义 NonFiction 纪实的 Synchronism 同步性 Constructivism 建构主义 surreal,hyperrealistc 超现实主义 futuristic 未来主义 ww3 style ww3 风格 fantasy 适合科幻场景 Fiction 科幻的 Science Fiction 科幻 scifi 科幻风格 cyber punk 赛博朋克 concept art 概念艺术 Hyperrealistic 超现实主义 Dark Fantasy 黑暗奇幻 Ethereal Fantasy 飘渺奇幻 studio Ghibli 宫崎骏风格 landscape 山水画 Makoto Shinkai 新海诚 Soejima Shigenori 副岛成记 Yamada Akihiro 山田章博 Munashichi 六七质 Watercolor children's illustration 水彩儿童插画 Ghibli Studio 吉卜力风格 Stained glass window 彩色玻璃窗 ink illustration 水茎插图 Miyazaki Hayao style 宫崎骏风格 Vincent Van Gogh 梵高 manga 漫画 pointillism 点彩派 Claude Monet 克劳德莫奈 quilted art 桁缝艺术 partial anatomy 局部解剖 color ink on paper 彩墨纸本 doodle 涂鸦 Voynich manuscript 伏尼契手稿 book page 书页 realistic 真实的 3D 3D 风格 sophisticated 复杂的 photoreal 真实感 national geographic 国家地理 hyperrealism 超写实主义 cinematic 电影股的 architectural sketching 建筑素描 symmetrical portrait 对称肖像 clear facial features 清晰的面部特征 interior design 室内设计 weapon design 武器设计 subsurface scattering 次表面散射 Game scene graph 游戏场景图 character concept art 角色概念艺术
2024-09-29
有AI绘画的风格化提示词吗,最好是英文加中文的
以下是一些 AI 绘画的风格化提示词,包括英文和中文: Trending on artsationA 站趋势风格 surrealism 超现实风格 oil painting 油画风格 Original 原画风格 Cyberpunk 赛博朋克风格 postimpressionism 后印象主义风格 Wasteland Punk 废土风格 digitally engraved 数字雕刻风格 architectural design 建筑设计风格 poster style 海报风格 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyoe 浮世绘 Manga style 日本漫画风格 stock illustration style 童话故事书插图风格 CGSociety 梦工厂动画风格 DreamWorks Pictures 梦工厂影业 Pixar 皮克斯 Fashion 时尚 poster of Japanese graphic design 日本海报风格 90s video game 90 年代电视游戏 french art 法国艺术 Bauhaus 包豪斯 Anime 日本动画片 "卜绘 and Pixel Art 像素画 Vintage 古典风,1819 世纪 Pulp Noir 黑白电影时期 Country style 乡村风格 Abstract 抽象风 risograph iso 印刷风 Graphic 设计风 ink render 墨水渲染 Ethnic Art 民族艺术 retro dark vintage 复古黑暗 Tradition Chinese Ink Painting style 国风 Steampunk 蒸汽朋克 film photography 电影摄影风格 concept art 概念艺术 montage 剪辑 full details 充满细节 Gothic gloomy 哥特式黑暗 realism 写实主义 black and white 黑白 Unity Creations 统一创作 Baroque 巴洛克时期 Impressionism 印象派 Art Nouveau 新艺术风格 Rococo 新艺术 Renaissance 文艺复兴 Fauvism 野兽派 Cubism 立体派 Abstract Art 抽象表现主义 OP Art/Optical Art 欧普艺术/光效应艺术 Victorian 维多利亚时代 futuristic 未来主义 Minimalist 极简主义 brutalist 粗犷主义 Constructivist 建构主义 botw 旷野之息 Warframe 星际战甲 Pokemon 至可梦 APEX Apex 英雄 The Elder Scrolls 上古卷轴 From Software 魂系游戏 Detroit:Become Human 底特律:变人 AFK Arena 剑与远征 cookierun kingdom 姜饼人 League of legends 英雄联盟 jojo's bizarre adventure Jolo 的奇妙冒险 gothic 哥特式 Ukiyoe 日本浮世绘风格 Traditional Chinese painting 中国国画 coil painting 油画 realism 现实主义 film noir 黑暗风格 water colour painting 水彩画 Romanticism 浪漫主义 Renaissance Art 文艺复兴风格 Neoclassicism 古典主义 academic art 学院派 hyperrealism 写实主义 Japonism 日式风格 Baroque 巴洛克式 folk art 民间艺术 ink painting 水墨画 ancient Egypt 古埃及 manuscript 手稿 Academicism 学院主义 Miserablism 愁苦主义 Ancient Greek art 古希腊艺术 Disney style 迪士尼风格 Picos style 皮克斯风格 illustration 插画风格 Japanese manga style 日本漫画风格 digital illustration 数字插画 dark fantasy style 黑暗幻想风格 Pop art 波普艺术 impressionism 印象派 Neoimpressionism 后印象派 fauvism 野兽派 expressionism 表现主义 abstract expressionism 抽象表现主义 cubism 立体主义 contemporary art 当代艺术 anime style 动画风格 cartoon 卡通 visionary art 视觉艺术 comic book 漫画书 streampunk 蒸汽朋克 dark theme 黑暗主题 miniature model film 微缩模型电影 DC Comics 能生成美漫封面的漫画画面 pixiv 纯二次元风格人像 style ofAl Williamson 威廉森风格 Bauhaus Style 包豪斯风格 Warhol 安迪·沃霍尔风格 Luminsm 光色主义 Magic Realism 魔幻现实主义 Fantastic Realism 魔幻现实主义 Classical Realism 批判现实主义 Pixel art 像素艺术 Contemporary Realism 当代写实主义 NonFiction 纪实的 Synchronism 同步性 Constructivism 建构主义 surreal,hyperrealistc 超现实主义 futuristic 未来主义 ww3 style ww3 风格 fantasy 适合科幻场景 Fiction 科幻的 Science Fiction 科幻 scifi 科幻风格 cyber punk 赛博朋克 concept art 概念艺术 Hyperrealistic 超现实主义 Dark Fantasy 黑暗奇幻 Ethereal Fantasy 飘渺奇幻 studio Ghibli 宫崎骏风格 landscape 山水画 Makoto Shinkai 新海诚 Soejima Shigenori 副岛成记 Yamada Akihiro 山田章博 Munashichi 六七质 Watercolor children's illustration 水彩儿童插画 Ghibli Studio 吉卜力风格 Stained glass window 彩色玻璃窗 ink illustration 水茎插图 Miyazaki Hayao style 宫崎骏风格 Vincent Van Gogh 梵高 manga 漫画 pointillism 点彩派 Claude Monet 克劳德莫奈 quilted art 桁缝艺术 partial anatomy 局部解剖 color ink on paper 彩墨纸本 doodle 涂鸦 Voynich manuscript 伏尼契手稿 book page 书页 realistic 真实的 3D 3D 风格 sophisticated 复杂的 photoreal 真实感 national geographic 国家地理 hyperrealism 超写实主义 cinematic 电影股的 architectural sketching 建筑素描 symmetrical portrait 对称肖像 clear facial features 清晰的面部特征 interior design 室内设计 weapon design 武器设计 subsurface scattering 次表面散射 Game scene graph 游戏场景图 character concept art 角色概念艺术
2024-09-29
浅谈“生成式人工智能在中职实训课的应用”
生成式人工智能在中职实训课的应用: 生成式人工智能是一种能够生成新的、未曾存在内容的人工智能技术,所生成的内容可以是多模态的,包括文本(如文章、报告、诗歌等)、图像(如绘画、设计图、合成照片等)、音频(如音乐、语音、环境声音等)、视频(如电影剪辑、教程、仿真等)。 其应用场景广泛,例如: 文档摘要:将长篇文章或报告总结为简短、精准的摘要。 信息提取:从大量数据中识别并提取关键信息。 代码生成:根据用户的描述自动编写代码。 营销活动创建:生成广告文案、设计图像等。 虚拟协助:例如智能聊天机器人、虚拟客服等。 呼叫中心机器人:能够处理客户的电话请求。 生成式人工智能的工作方式如下: 1. 训练阶段:通过从大量现有内容(文本、音频、视频等)中学习进行训练,训练的结果是一个“基础模型”。 2. 应用阶段:基础模型可以用于生成内容并解决一般性问题,还可以使用特定领域的新数据集进一步训练,以解决特定问题,从而得到一个量身定制的新模型。 Google Cloud 提供了相关工具,如 Vertex AI 是端到端机器学习开发平台,旨在帮助开发人员构建、部署和管理机器学习模型;Generative AI Studio 允许应用程序开发人员或数据科学家快速制作原型和自定义生成式 AI 模型,无需代码或代码量少;Model Garden 是一个平台,可以让用户发现 Google 的基础和第三方开源模型,并与之交互,它提供了一组 MLOps 工具,用于自动化机器学习管道。 在教育领域,从 AI 助教到智慧学伴的应用探索中,以“移动教学与促动”课程实习周为例,让教育学专业的学生了解和尝试运用教育 APP、二维码、教育游戏等技术方式开展移动教学。课程实习需要在 5 天内让非技术背景的学生分组设计课程并展示,由于学生众多,教师难以给予个性化指导,而 AI 在一定程度上补足了学生缺乏的经验。
2025-03-31
生成式人工智能原理是什么
生成式人工智能的原理主要包括以下几个方面: 1. 基于深度学习技术和机器学习算法:通过大规模的数据集训练深度神经网络模型,学习各种数据的规律和特征,从而实现对输入数据的分析、理解和生成。 2. 监督学习:例如在生成文本时使用大语言模型,通过监督学习不断预测下一个词语,经过大量的数据训练,从而生成新的文本内容。这通常需要千亿甚至万亿级别的单词数据库。 3. 从大量现有内容中学习:包括文本、音频和视频等多模式的内容,这个学习过程称为训练,其结果是创造“基础模型”,如为聊天机器人提供支持的大型语言模型(LLM)。基础模型可用于生成内容并解决一般问题,也可以使用特定领域的新数据集进一步训练以解决特定问题。
2025-03-26
生成式AI的教育重构价值
生成式 AI 在教育领域具有重要的重构价值,主要体现在以下几个方面: 1. 为教师减负:通过复杂的算法、模型和规则,从大规模数据集中学习,创造新的原创内容,帮助教师减轻工作负担。 2. 创新教学方式:例如让历史人物亲自授课,知识获取不再受时空限制,提高教育效率和质量,增强学生学习兴趣。 3. 个性化教育:根据学生的学习情况、兴趣和偏好提供定制化的学习计划和资源,实现因材施教,满足学生学习需求,提高学习成果,缓解教育资源不平等问题。 4. 角色多样化:授课教师、游戏玩家、情感伴侣等服务都可以被 AI 重构。 5. 促进学生成长:人工智能生成的虚拟角色可以作为数字陪伴,给予孩子社会奖励,促进其成长和提高学习成绩。
2025-03-22
Stable Diffusion、MidJourney、DALL·E 这些生成式AI工具有什么区别
Stable Diffusion、Midjourney 和 DALL·E 这三个生成式 AI 工具主要有以下区别: 1. 开源性:Stable Diffusion 是开源的,用户可以在任何高端计算机上运行。 2. 学习曲线:Midjourney 的学习曲线较低,只需键入特定的提示就能得到较好的结果。 3. 图像质量:Midjourney 被认为是 2023 年中期图像质量最好的系统。 4. 应用场景:Stable Diffusion 特别适合将 AI 与来自其他源的图像结合;Adobe Firefly 内置在各种 Adobe 产品中,但在质量方面落后于 DALL·E 和 Midjourney。 5. 训练数据:这些工具都是使用大量的内容数据集进行训练的,例如 Stable Diffusion 是在从网络上抓取的超过 50 亿的图像/标题对上进行训练的。 6. 所属公司:DALL·E 来自 OpenAI。 在使用方面: 1. Stable Diffusion 开始使用需要付出努力,因为要学会正确制作提示,但一旦掌握,能产生很好的结果。 2. DALL·E 已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠,但图像质量比 Midjourney 差。 3. Midjourney 需要 Discord,使用时需键入特定格式的提示。
2025-03-20
生成式人工智能的提示词工程
生成式人工智能的提示词工程是一门新兴学科,在生成式 AI 模型中具有重要作用。 提示词是用户与模型沟通愿望的文本界面,适用于图像生成模型(如 DALLE3、Midjourney)和语言模型(如 GPT4、Gemini)等。它可以是简单的问题,也可以是复杂的任务,包括指令、问题、输入数据和示例,以引导 AI 的响应。 提示词工程的核心是制作能实现特定目标的最佳提示词,这不仅要指导模型,还需深刻理解模型的能力和局限性及所处上下文。例如,在图像生成模型中是对期望图像的详细描述,在语言模型中可能是复杂查询。 提示词工程不仅是构建提示词,还需结合领域知识、对 AI 模型的理解及系统化方法为不同情境定制提示词,可能包括创建可根据数据集或上下文程序化修改的模板。 此外,提示词工程是迭代和探索的过程,类似于传统软件工程实践,如版本控制和回归测试。该领域发展迅速,有潜力改变机器学习的某些方面。 在商业和社会中,提示词工程师是被炒作的职位,实际可能承担了机器学习工程师的部分职责。提示词工程是一切生成式 AI 的基础,不管用于学习、写作、绘画、编程还是玩音乐等。 在使用提示词时,要记住几个基本关键点: 1. 角色/身份:告诉 AI 它需要扮演的身份,提升其“职业素养”。 2. 目标/任务以及背景:所有对话都有目的性,要交代目标背后的逻辑,包括为什么要实现目标、希望达到的结果等。
2025-03-19
生成式AI
生成式 AI(Generative AI)是一种基于深度学习技术,利用机器学习算法从已有数据中学习并生成新的数据或内容的 AI 应用。其工作原理是通过大规模的数据集训练深度神经网络模型,学习各种数据的规律和特征,实现对输入数据的分析、理解和生成。 AIGC(AI generated content)意为人工智能生成内容,又称为生成式 AI。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。能进行 AIGC 的产品项目和媒介很多,包括语言文字类(如 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等)、语音声音类(如 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等)、图片美术类(如早期的 GEN、去年大热的扩散模型带火的 Midjourney、先驱者谷歌的 Disco Diffusion、OpenAI 的 Dalle·2 以及 stability ai 和 runaway 共同推出的 Stable Diffusion 等)。 SD 是 Stable Diffusion 的简称,是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。 国内目前主要是在《网络安全法》《数据安全法》以及《个人信息保护法》的框架下,由《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》共同监管 AIGC 行业。 Gen AI/Generative AI 是“生成式人工智能”正式称呼,是一种能够生成新内容的人工智能技术,比如文本、图像、音乐等。而 AIGC 指的是由人工智能生成的内容的创作方式,实际上是 Generative AI 的应用结果。 ChatGPT 在 2022 年宣发时,OpenAI 称其是一种模型,但在官网的帮助页面中,称其是一种服务。目前我们所熟知的 ChatGPT 逐渐演变成了一种可以兼容多种 GPT 模型的聊天应用(服务)。
2025-03-19
什么是AGI
AGI 即人工通用智能,通常被定义为一种能够完成任何聪明人类所能完成的智力任务的人工智能,其能力不局限于特定领域。 例如,OpenAI 的相关计划中,Q2025(GPT8)将实现完全的 AGI,但因一些原因有所推迟。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。 在关于 AGI 实现后未来 20 年人类社会的变革的研究中,AGI 的出现被视为人类历史上具有转折意义的事件。 Sam Altman 认为,呈现人工通用智能特征的系统正浮现,人工通用智能通常指一种能够在许多领域内以人类水平应对日益复杂的问题的系统,它是人类进步脚手架上的另一个工具。
2025-04-18
什么是AGI
AGI 即人工通用智能,通常指能够完成任何聪明人类所能完成的智力任务的人工智能,其能力不局限于特定领域。例如,能够在许多领域内以人类水平应对日益复杂的问题。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。AGI 的出现被视为人类历史上具有转折意义的事件,当 AGI 真正实现并可能迅速发展为超人工智能(ASI)时,人类社会将在随后的二十年里经历深刻变革,包括社会结构、价值观、权力格局、人类角色等多个方面。我们的使命应是确保 AGI 造福全人类,从某种意义上说,AGI 是人类进步脚手架上的另一个工具。
2025-04-15
waytoagi 简单介绍
“通往 AGI 之路”(WaytoAGI)是一个致力于人工智能学习的中文知识库和社区平台: 旨在为学习者提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面,帮助用户有效地获取 AI 知识,提高自身能力。 由开发者、学者和 AI 爱好者共同参与建设,提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 其品牌 VI 融合了独特的设计元素: 选择彩虹色作为主要的配色方案,代表多样性、包容性和创新。 标志性图案是一只鹿,与“路”谐音,象征着通往 AGI 未来的道路,寓意优雅与智慧。 选用简洁现代的非衬线字体,强调信息传达的清晰度和直接性。 此外,WaytoAGI 里有个离谱村: 是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。 参与者不分年龄层,一起脑洞和创意,都可以通过 AI 工具快速简单地创作出各种各样的作品。 离谱村是一个没有被定义的地方,每个人心中都有自己想象中的离谱村,是灵魂的避风港,激励着每一个生命体发挥其无限的想象力,创造属于自己的独特生活方式。 如果您对 AI 学习感兴趣,加入“通往 AGI 之路”社区将是一个不错的选择。在这里,您可以获取最新的 AI 知识,参与实践活动,与志同道合的学习者共同成长。
2025-04-14
我想将常用的AI入口手机放在一张网页上,该如何设置waytoAGI页面
以下是关于将常用的 AI 入口放在一张网页上设置 WaytoAGI 页面的方法: 1. 点开链接就能看:不用注册,不用花钱,直接点击。 2. 想看啥就看啥:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 3. 有问题还能问:如果看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。 另外,关于使用 Cursor 制作您的第一个主页: 1. 在搞定一个非常简单的小游戏之后,可以做一个自己的个人介绍网站。可以先看看官网,比如 allinagi.com.cn、sboat.cn。假设要做一个《全 AI 自动驾驶的火星登陆飞船》项目,首先会有一个初步简单的项目介绍,比如 WaytoMars 是一个制造、运营全 AI 自动驾驶的火星登陆飞船公司品牌,有着领先全球的技术实力、人才优势,预计在 2030 年推出可承载上千人,五星豪华级的全 AI 自动驾驶的火星登陆飞船。有了项目介绍后,让 AI 帮助生成一个具有前端大师级审美、极富科幻感的网站首页。首先,新建一个 waytomars 文件夹并打开,在 AI 对话框中输入上述的话,一路等待 AI 制作以及加入您的修改意见即可。 2. 如何让别人看到您的作品预览:通过将项目文件夹整体上传,就可以生成一个临时浏览链接,在不需要域名和服务器的情况下让外部也能够看到您的作品。注意:如果发现 cursor 有所卡顿,注意是不是 AI 让您在终端区或者对话区确认重要操作,左下角将 ask every time 修改为 auto run 就可以全自动化了。 WaytoAGI 就是一个帮您快速入门 AI、学会用 AI 搞事情的“武器库”。不管您是完全不懂 AI 的小白,还是想用 AI 赚钱的普通人,它都能帮到您。AI 是未来的趋势,现在学一点都不晚,如果您想了解 AI、用 AI、甚至靠 AI 搞钱,WaytoAGI 就是您最该看的“AI 宝典”。
2025-04-14
WaytoAGI:找到了AI知识付费的免费源头,让更多人因AI而强大!
WayToAGI(通往AGI之路)是一个由热爱AI的专家和爱好者共同建设的开源AI知识库。它具有以下特点和优势: 1. 整合了各种AI资源,让大家能轻松学习AI知识,应用各类AI工具和实战案例。 2. 提供了一系列开箱即用的工具,如文生图、文生视频、文生语音等的详尽教程。 3. 时刻追踪AI领域最新进展并更新,每次访问都有新收获。 4. 涵盖丰富的内容,包括AI视频、AI绘画、AI音乐、AI艺术、AI即兴戏剧、AI Agent共学等。 5. 为用户提供全面系统的AI学习路径,辅助思考,让学习过程少走弯路。 6. 自 2023 年 4 月 26 日诞生,在无推广情况下,一年已有超 70 万用户和超千万次访问量。社群的口号是让更多的人因 AI 而强大,有很多学社和共学共建的活动。访问“waytoagi.com”即可找到社群。
2025-04-12
身份是小学语文老师,如何自学waytoAGI
以下是为您整理的相关内容: 1. 10 月 9 日小作业中提到:熟悉 waytoagi 知识库,并找到 Prompt 提示词框架文章,给出两个提示词框架和生成结果。框架一是“CRISPE 框架”,处理小学六年级同学丢钱引发的同桌纠纷,给出三种解决方式,包括调查真相、教育双方,全班寻找失物、避免误解,引导调解与反思。生成结果为详细的解决步骤。同时提到人工智能时代的三个基石是数据、算法、算力,数据和算法可在开源数据库等找到,算力可在云计算平台如 AWS、Google Cloud、Microsoft Azure 找到。 2. 6 月 11 日 AI 秒学团队中,有人分享了搭建聊天功能工作流的经历,提到在实践中不断迭代、调整和优化。一位纯社科背景的高校老师感谢 way to AGI 带文科生进入 agent 的“坑”,并提到小团队给予的帮助。 3. 问卷中,刘翔宇表示自己是国内一线互联网 AI 产品经理,愿意共同维护 WaytoAGI 开源社区,学习目标是了解 Comfy 基础理论等多方面,所在城市为北京。
2025-04-12
推荐一款根据自拍照生成动漫风格头像的网站
以下为您推荐使用 Midjourney 网站根据自拍照生成动漫风格头像的方法: 背景: 之前制作过相关视频,教大家从零开始使用 Midjourney 并通过简单提示词生成图片。今天教您利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格头像。 操作: 1. 选择一张满意的自拍照,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,发送(记得点击回车或发送按钮)。 图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制链接。 2. 复杂提示词: 如果觉得简单提示词不够好,可以使用更复杂的提示词,如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 效果会因提示词和照片不同而有所差异。 若对照片风格不满意,可更换新照片重新生成。 若觉得 Disney 风格太过卡通,可把提示词中的 Disney 换成 Pixar;若为女孩,把 boy 换成 girl。 每次生成 4 张图片,对某张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。 3. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,把刚才的链接放进去,然后空格,加一些提示词(以英文逗号分隔),最后加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 s 500 设置风格强度、个性化、艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses 指不戴眼镜,若不喜欢戴眼镜的图片,可加上此设置。 完整的提示词如下(替换您的 png 图片地址):simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5 。若不满意,可调整s 和iw 的值多次尝试。 如果您还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程:
2025-03-31
照片转动漫的工具
以下为一些照片转动漫的工具及相关信息: 1. VIGGLE: 是一款创新的可控视频生成平台,基于 JST1 技术,允许用户自由创建和控制 3D 角色的动作,在游戏开发、动画制作及 VR/AR 等领域有巨大潜力。 Viggle AI 是利用骨骼动画将图片转化为一致性角色动画的工具,简化了动画制作流程。 体验地址:https://www.viggle.ai/ 官方 Discord:https://discord.gg/viggle 操作方式(以网页端举例): Upload a character image of any size.上传任意尺寸的角色图像。 For better results,use a fullbody photo with a clean background.为了获得更好的效果,请使用背景干净的全身照片。 Image size图像大小(最大 10MB) 您上传的照片必须符合社区规则。 2. 莱森: 利用一致性 MJ 出海马体写真的教程。 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好了。 关注醒图【人像>面部重塑>面部>比例】,调整上庭、中庭、下庭。 在转绘部分,照片>Minecraft 风格幅度变化大时,若sw 风格权重拉满仍复制不了像素小人风格,可能是cw 太高,调低 cw 可能成功复制。 cref 和 sref 同时参考多张 url 时,上传同一个人不同角度的照片,容易使结果畸形。 若 MJ 直出的皮肤缺乏质感,可打开醒图【人像>手动美颜>皮肤肌理】。 若想快速调整光源,可试试 Luminar,可官方下载购买完整版,或在 macos 订阅 setapp 使用有基础功能的 Luminar 版本。 3. 个性: 操作: 复杂提示词,如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 不同照片生成,若对照片风格不满意可更换照片使用相同提示词重新生成。 其他调整,如觉得 Disney 风格太过卡通,可把提示词里的 Disney 换成 Pixar,若为女孩,可把 boy 换成 girl。每次生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。
2025-03-19
文案生成动漫
以下是为您提供的关于文案生成动漫的相关信息: Anifusion 工具: 这是一款基于人工智能的在线工具,网址为 https://anifusion.ai/ ,其 Twitter 账号为 https://x.com/anifusion_ai 。 主要功能: AI 文本生成漫画:输入描述性提示,AI 生成漫画页面或图像。 直观的布局工具:提供预设模板,可自定义漫画布局。 强大的画布编辑器:在浏览器中优化和完善 AI 生成的作品。 多种 AI 模型支持:高级用户可访问多种 LoRA 模型实现不同风格和效果。 商业使用权:用户对创作作品拥有完整商业使用权。 使用案例: 独立漫画创作。 快速原型设计。 教育内容创作。 营销材料制作。 粉丝艺术和同人志创作。 优点:非艺术家也能轻松创作漫画,基于浏览器无需额外软件,具备快速迭代和原型设计能力,拥有创作的全部商业权利。 利用 AI 批量生成、模仿和复刻《小林漫画》: 需求分析:选用扣子搭建工作流,解决国内可直接使用且批量生产的需求,可能需牺牲一定质量的文案和图片效果。 批量生成句子:建议一次不要生成太多,如设置一次生成五句。 句子提取:将生成的句子逐个提取,针对每个句子画图。 图片生成:根据句子结合特有画风等描述绘图。 图片和句子结合:由于扣子工作流环境缺少相关包,可替换为搞定设计或使用 PS 脚本处理图片。 输入观点一键生成文案短视频: 概述:基于其他博主开源的视频生成工作流进行功能优化,实现视频全自动创建。 功能:通过表单输入主题观点,自动创建文案短视频,并推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径: 通过 Coze 创建智能体,创建工作流,使用 DeepSeek R1 创建文案和视频。 发布 Coze 智能体到飞书多维表格。 在多维表格中使用字段捷径引用智能体。 在多维表格中创建自动化流程,推送消息给指定飞书用户。
2025-03-16
出图是动漫/真人有什么区别和需要注意的点?
动漫出图和真人出图有以下区别和需要注意的点: 版权和法律意识:对于知名动漫角色的使用,要特别注意版权和法律问题。 模型和文件:LORA 在提炼图片特征方面功能强大,其文件通常有几十上百兆,承载的信息量远大于 Embedding,在还原真人物品时,LORA 的细节精度更高。下载的 LORA 需放在特定文件夹,使用时要注意作者使用的大模型,通常配套使用效果最佳,同时还需加入特定触发词保证正常使用。 提示词:设置文生图提示词时,正向提示词和负向提示词的准确设定对出图效果有重要影响。 参数设置:包括迭代步数、采样方法、尺寸等参数的合理设置,会影响出图的质量和效果。
2025-03-16
动漫脸部修复
以下是关于动漫脸部修复的相关内容: GFPGAN 面部修复: 找一张模糊人像进行修复,其他参数不变,直接将 GFPGAN 参数拉到 1 即可。面部修复效果显著,但只能修复脸部,头发、衣服、背景等无变化。 背景去除: 需要安装插件 REMBG,安装地址是 https://github.com/AUTOMATIC1111/stablediffusionwebuirembg.git 。安装好之后重启,就有选项框。 测试时模型选第一个 u2net,直接点击生成。抠图效果不错但边缘轮廓可能有黑边,用时 2.86 秒。 去掉黑边可点击后面的 Alpha matting 调整参数,如 Erode size:6、Foreground threshold:143、Background threshold:187,就能得到无黑边图像。 点击按钮还可直接生成蒙版。有专门做服装抠图和动漫抠图的模型。 手部修复: 对于动漫人物手部修复,先在 3D 骨架模型编辑器中手动调整还原骨架,若为写实人物可使用 openpose 预处理器进行姿态检测。 来到深度图库,修改尺寸并载入骨架图,选择合适手势添加,可发送到 controlnet。 启用 controlnet 时选择相应预处理器,在图生图中进行手部局部重绘,绘制蒙版,可一只手一只手调整,之后在 ps 中使用“创成式填充”修补衔接区域。 SD 新手入门图文教程中的相关内容: 放大算法中,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 效果不佳,ESRGAN_4x、SwinR 4x 对 0.5 以下重绘幅度支持较好。 Hires step 表示进行这一步时计算的步数。 Denoising strength 表现为生成图片对原始输入图像内容的变化程度,一般阈值 0.7 左右,超过 0.7 与原图基本无关,0.3 以下稍作修改。 面部修复可修复人物面部,但非写实风格人物开启可能导致面部崩坏。
2025-03-13
我想用ai动漫人物唱歌
以下是一些可以帮助您实现用 AI 动漫人物唱歌的相关信息和资源: 在 AI 图像处理方面,有一些项目可以将图像进行动漫化处理,例如卡通头像制作等。 在音频与音乐制作方面,有专属歌曲创作、声音克隆、AI 唱歌等项目。比如制作专属歌曲、声音克隆/视频对口型等。 腾讯 AniPortrait 可以根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制。相关链接:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20 。 Hedra Studio 推出的 Character3 AI 支持全身动态与情感控制,能唱歌、说话甚至表演。
2025-03-12