Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

推荐一个做二次元风格的数字人的软件

Answer

以下为您推荐一些可用于制作二次元风格数字人的软件:

  1. Live2D Cubism(https://www.live2d.com/):这是一款 2D 引擎,风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。
  2. 剪映:虽然本身有很多公模数字人,但可以通过 AI 换脸软件(如按照以下步骤操作:第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusion-colab 并点击 open colab 就进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面;第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成;第三步:等着自己专属的数字人视频出炉)来实现数字人的“私有化”。

此外,关于数字人的更多知识和操作,您还可以参考以下内容:

  • 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。
  • 笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。

有关数字人使用上的问题,欢迎在底部评论区留言,一起交流。同时如果对数字人课程感兴趣的话,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程!

Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署,最后呈现在用户面前的是一个GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了live2d作为数字人躯壳,因为这类SDK的驱动方式相比现在的AI生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于live2d的SDK驱动方式可以参考官方示例:https://github.com/Live2D。

方案:剪映数字人“个性化“—无限免费私模数字人

尽管剪映已经有很多公模数字人,但是从抖音上大火的数字人账号上看,私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。?注意:需要谷歌账号(淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买)1.第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面2.第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成!反复调试后给大家选出了最佳参数!1.第三步:等着自己专属的数字人视频出炉!有关数字人使用上的问题,欢迎在底部评论区留言,一起交流~同时如果对数字人课程感兴趣的话,欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程!?课程内容:[实战课程:数字人课程](https://waytoagi.feishu.cn/wiki/JOWjwM0qfi2rYVkUIwychk9MnSh)?在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 ?:aiwarts101

Others are asking
二次元与ai有什么结合变现的思路
以下是二次元与 AI 结合变现的一些思路: 1. 以 API 形式链接 Zion 和 Coze,为 dify、kimi 等大模型和智能体制作收费前端。您可以参考相关教程,如: 2. 自定义配置变现模版的 UI 交互、API、数据库等拓展功能,支持在 Zion 内自由修改,可参考文档配置。相关链接如下: 支付: Actionflow: 权限: 代码组件: 3. 微信小程序变现模版正在开发中,不久将会上线。目前实现小程序端可以通过 API 形式搭建。 4. Zion 支持小程序、Web、AI 行为流全栈搭建,APP 端全栈搭建 2025 上线。 在摊位信息方面,有以下与二次元和 AI 结合的示例: 1. 乐易科学院:通过 AI 的技术,结合量子、暗物质、天体运行规律等能量形式,从科学、物理学、天文学、心理学等方面讲解国学和传统文化。可以通过技术方式批八字、调风水、进行性格色彩分析,让每个人找到方向,成为更好的自己。摊位区域为 C,编号 27,类型为玄学+科学。 2. AIGC 策划程序美术(3AI 简称 3A 游戏)应用独立游戏开发,摊位区域为 C,编号 76,类型为游戏宣传。 3. AI 人像摄影绘画,摊位区域为 C,编号 77,类型为照片。 4. 主题是:B2B AI 营销与 AI 落地项目快速落地,涵盖 3 个方向: AI 训练 to b,出应用,智能体 agent,文生图生视频都涉及。 美国独立站搭建,工作流给模特戴上珠宝饰品。 Google seo 与 AI 结合。 在 AI 原画设计方面,Niji·journey 5 是一款在二次元领域表现出色的绘画 AI 工具。二次元作品具有较高的规律性,角色、场景和物品往往有明显的风格特征和设计规律,AI 能够更容易地从海量训练数据中学习和总结这些规律。同时,二次元角色设计更注重创意和审美,而非真实世界的物理规律,这使得 AI 在设计过程中可以专注于发挥其“想象力”和“创造力”。
2025-03-24
AI画二次元头像的软件或网站
以下是一些可以用于绘制二次元头像的软件或网站: 1. 无界 AI: 网址:https://www.wujieai.cc/ 新用户扫码注册可领取积分。 基础关键词: 二次元插画:画面质量为大师作品、最佳质量、精致细节、高细节、完美的脸;画面内容为少女、云朵、夏日、蓝天、海洋、;风格控制为可爱风格;背景控制为蓝色背景、纯色背景、简单背景。 平面构成:平面艺术、平面构成、几何线条、红蓝。 参数设置: 模型选择:风格模型或通用模型。 画面大小:3:4 社交媒体(推荐竖构图)。 底模选择:二次元→动感涂鸦;模型主题:写实插画;风格选择:Glitch 艺术+街头涂鸦。 2. 无界 AI 还可用于快速制作海报,其做图逻辑类似于 SD,优势在于国内网络即可稳定使用、有免费出图点数、支持中文关键词输入、无需额外下载风格模型,可直接取用。使用模型如皮克斯卡通,本案例中朋友圈 po 图的画幅比例选择 1:1。关键词类别包括场景、氛围、人物、造型、情绪、道具、构图、画面、特殊等方面。
2024-12-04
如何制作AI二次元动画
以下是一些关于制作 AI 二次元动画的方法和资源: 1. 您可以参考视频“”,其步骤为:通过 Midjourney 生成图像后,使用 let's enhance.io 增强图像质量,然后使用 Monster Mash 将图像转换为 3D,再导入 Cinema 4D 进行材质、光影以及场景布置,最后使用 After Effects 进行渲染和处理。 2. 对于构建数字人躯壳,开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 3. 如果您想制作 AI 海报,可使用无界 AI(网址:https://www.wujieai.cc/),其做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。在制作二次元风格海报时,可选择皮克斯卡通模型,设定相关关键词类别,如场景(向日葵花田、面包店等)、氛围(温馨、温暖等)、人物(父亲和女儿、父亲和儿子等)、造型(发型、发色、服饰、配饰等)、情绪(笑得很开心、大笑、对视等)、道具(童话书等)、构图(半身、中景等)、画面(色彩明艳)等。
2024-10-05
如何用midjourney生成等距视角的,二次元画风的 房间内饰参考设计图
以下是使用 Midjourney 生成等距视角、二次元画风的房间内饰参考设计图的一些方法和关键词示例: 1. 欧式风格:Interior Design,European style,home with desk,lamp,bookshelf,wooden board 2. 极简风格:Minimalist style,floortoceiling Windows,living room,Architecture 3. 独有风格(Explode 艺术家):Explode+物体描述词+by Nychos(这位艺术家画风具有放射性) 4. 字符艺术:描述物体+ASCII art 5. 欧普艺术:Op art portrait+描述文字 6. 粘土风格(图标):Tiny cute isometric(等距)+(物体)+maxemoji,soft lightingsoft pastel colors+3Dicon+clay+blender 3d+名人画风(或者背景颜色) 需要注意的是: 1. 等距+物体+maxemoji,soft lightingsoft pastel colors/pastel background+3Dicon+clay+blender 3d+背景颜色=等距粘土物体 2. yasuko blythe dolls(安子布莱斯娃娃/也可以换成其他知道的娃娃名称)+灯光/颜色/背景/材质+clay(粘土)+style Yoshitomo Nara(良奈吉友画风/或者其他名人风格)=人偶
2024-08-14
如何用ai输入二次元风格的提示词
二次元风格通常指的是源自日本的动漫、漫画和游戏文化中的视觉艺术风格。使用AI生成二次元风格的提示词,您可以遵循以下步骤: 1. 确定主题: 确定您想要的二次元风格的主题,比如是校园生活、幻想世界、科幻未来等。 2. 了解风格特点: 研究二次元风格的特点,包括角色设计(如大眼睛、多彩发色)、服饰风格、场景构图等。 3. 使用描述性语言: 使用描述性的语言来表达您想要的风格,比如“穿着日本高中制服的少女,背景是樱花盛开的校园”。 4. 利用AI工具: 使用支持文本到图像的AI工具,如DALLE、Stable Diffusion或Midjourney等,这些工具可以根据文本提示生成图像。 5. 输入提示词: 在AI工具中输入您的提示词,可以包括角色特征、环境元素、动作等,越详细越好。 6. 调整和优化: 根据生成的图像结果,调整提示词,增加或减少描述的细节,以达到最佳效果。 7. 使用专业术语: 如果可能,使用一些二次元文化中的专业术语,比如“傲娇”、“御姐”、“萌”等,这可以帮助AI更准确地理解您的需求。 8. 考虑情感和氛围: 二次元作品常常带有特定的情感和氛围,比如“温馨的日常场景”或“激烈的战斗场面”,在提示词中包含这些元素。 9. 迭代过程: 生成图像后,根据结果反复迭代您的提示词,直到获得满意的风格。 10. 获取反馈: 如果可能,从二次元社区获取反馈,看看您的提示词是否能够准确地传达您想要的风格。 例如,如果您想生成一个二次元风格的女战士形象,您的提示词可能是:“一个身穿未来机甲的女战士,手持光剑,背后是战争废墟的末世城市,眼神坚定。” 记住,不同的AI工具可能对提示词的理解和反应不同,所以实验和迭代是得到理想结果的关键。
2024-07-22
midjourney如何画二次元
Midjourney 是一个强大的 AI 图像生成工具,它支持多种风格和类型的图像创作,包括二次元风格的绘画。以下是使用 Midjourney 绘制二次元图像的一些基本步骤和技巧: 1. 了解二次元风格: 二次元通常指的是具有特定风格的日本动漫和漫画中的艺术形式。了解这种风格的特点是开始创作之前的重要步骤。 2. 使用正确的参数: Midjourney 支持多种参数来控制图像的生成。对于二次元风格,可以使用特定的参数,如 `v 5`(选择模型版本)和 `ar 16:9`(设置图像宽高比)。 3. 利用Niji模式: Midjourney 提供了一个名为 Niji 的二次元模型,专门为生成动漫风格的图像而设计。通过在命令中添加 `v 5 ar 2:3 stylize 500 q 2 ar 16:9` 参数,可以激活 Niji 模型。 4. 构建详细的提示词(Prompt): 提示词是告诉 Midjourney 你想要的图像类型和风格的关键。例如,如果你想生成一个穿着校服的二次元少女,你的提示词可能是 `"a school uniform anime girl with big eyes and long flowing hair"`。 5. 使用图生图(ImagetoImage): 如果你有一张现有的二次元图像,并且想要用 Midjourney 进行编辑或改进,可以使用图生图功能。上传你的图像并提供相应的提示词来指导 AI。 6. 调整权重和风格: 通过调整不同元素的权重,可以控制生成图像的特定方面,如颜色、细节或风格。 7. 迭代和实验: 由于 AI 生成图像的过程涉及随机性,可能需要多次尝试和调整提示词来获得最佳结果。 8. 学习社区和教程: 加入 Midjourney 社区,查看其他艺术家的作品和教程,这可以提供灵感和学习的机会。 9. 参考官方教程和资源: Midjourney 的官方文档和教程是学习如何使用该工具的宝贵资源。 10. 审美提升: 观看推荐的电影和阅读推荐的书籍可以提升你对二次元风格的审美和理解。 请记住,生成理想的二次元图像可能需要一些实验和练习,但随着时间的推移,你将能够更好地掌握 Midjourney 的使用,并创作出令人满意的作品。
2024-05-12
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
AI办公相关的课程、软件教学
以下是为您提供的 AI 办公相关的课程和软件教学资源: 1. 90 分钟从 0 开始打造您的第一个 Coze 应用: 课程包含从零开始的应用界面教学,涉及过年相关应用。 介绍了当前承接的业务,包括辅导、培训、定制及企业 AI 落地等。 提到 11 月底应用推出背后的情况,包括社区对 AI 应用的呼声和功能需求挖掘。 2. AI 视频的软件教程: 涵盖了众多工具,如剪映、Dreamina、Pika、StableVideo、Pixverse、morphstudio、Runway Gen3、Adobe Firefly 以及清影等。 3. 张翼然:用 AI 为教师减负(3H).pdf: 包括教师的 AI 减负指南,生成式人工智能在教学中的应用。 介绍了教师使用 AI 的小技巧,如提示词设计公式之——RTFC。 涉及使用 AI 生成图片的方法与注意事项,AI 自动生成 PPT 功能。 展示了通过小程序实现文字与声音、视频的转化,自定义数字人形象进行教学。 展示了便捷的课堂教学工具与 Ai 课件制作,探讨了 A 生成视频与手工制作视频的教学效果差异。 强调了教育资源与版权问题,教师能力重塑,极简思维的教育应用,生成式 AI 教学策略。 包括 AI 技术助力教育管理和辅助教学实践,如班级与学校管理中的行政职日流程简化、听课记录自动化等。
2025-04-12
grok API能用在什么软件上
Grok API 可以用在以下软件上: 1. 扣子工作流:可以用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,还能参考相关教程将扣子接入微信机器人,但有微信封号风险。 2. 沉浸式翻译:由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品可以用来填 APIKEY 调用的场景,比如沉浸式翻译这个网页翻译工具。 3. 手机类 APP:比如通过快捷方式接入 Siri。 此外,xAI 发布的 Grok 3 API 提供了多个模型版本,如 grok3beta、mini、fast 等,满足不同场景需求,上下文窗口达 131K,支持图像输入输出,但当前不支持联网或实时访问外部网页与数据。
2025-04-12
人脸识别软件
以下是为您整合的关于人脸识别软件的相关信息: 在“【已结束】AI 创客松 参与同学自我介绍和分类”中,Dylan 擅长人脸识别算法和动作捕捉产品。 在“SmartBotX 模块化桌面机器人——说明文档”中,桌面客户端提供面部识别或跟踪功能的展示,可能用于安全监控、用户识别或交互式体验。 在“14、LayerStyle 副本”中,使用 YoloV8 模型可以检测人脸、手部 box 区域或者人物分割,支持输出所选择数量的通道。同时,Mediapipe 模型可以检测人脸五官,分割左右眉、眼睛、嘴唇和牙齿。
2025-04-12
文章配图的智能体或者软件
以下是为您整理的关于文章配图的智能体或软件的相关内容: 在《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》中提到,智能时代,智能应用会从有形界面消失,变成无所不在的助理或智能体,辅助甚至直接完成任务。文中还配有图 2.10:智能代理将改变企业组织架构。 在《XAIR:AI 智能体平台对决:腾讯元器与字节扣子的创新之路》中,个人实操案例部分提到为本篇文章配图的相关情况,但生成结果显示问题描述不够清楚。之后换提示词“那你给我生成搞笑图片吧,让人一看就有继续看下去的动力那种,需要一张公众号封面和一张配图”,得到了相应结果。同样的提示词,元器某应用也有生成。此外,文中还提到在搭建 bot 过程中存在工作流未成功触发导致访谈记录未成功存储入库的问题。
2025-04-11
和manus差不多的软件
以下是与 Manus 模式类似的软件: 1. Same.dev:像素级 UI 还原,自动生成对应代码,云端运行,支持自定义编码,但免费额度使用快,需输入 API,目前网站被标记危险。相关链接: 2. Genspark Super Agent:作为世界上首个 MixtureofAgents 系统,集多种功能于一体,能自动完成复杂任务。在 GAIA 基准测试的三个级别中得分均高于 Manus,具有近乎即时的结果、执行过程中错误和幻觉显著减少、让用户掌控一切并能指导和优化输出等优势。它是世界上第一个 MixtureofAgents 系统,利用最佳模型、工具和数据集来执行不同的任务,比如基础智能体的对话、图片、视频生成以及翻译。
2025-04-11
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
,当前AI数字人发展的新态势,以及新技术和成果
当前 AI 数字人的发展呈现出以下新态势,并取得了一系列新技术和成果: 数字人简介: 数字人是运用数字技术创造的,虽现阶段未达科幻作品中的高度智能,但已在生活多场景中出现且应用爆发。业界对其尚无准确定义,一般可按技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视和直播带货,其表现质量与建模精细度及动捕设备精密程度相关,不过视觉算法进步使在无昂贵动捕设备时也能通过摄像头捕捉关键点信息实现不错效果。 B 端变现与创业方向: B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。自媒体创业需具备内容创新和差异化,内容成本低且更新迭代快。游戏创业可做轻量化游戏,结合 AI 技术满足放松和社交需求,专注垂类赛道避免与大厂竞争。影视创业在 25 年将是拐点,更多内容会采用 AI 技术。广告营销创业重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: AI 虚拟人从早期以首位为核心的宅文化虚拟偶像,发展到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人。虚拟人产业链包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。未来 3 10 年,AI 虚拟人是 Web 3.0 的风口,提前布局有潜力的赛道可迎接机遇,但创业对创业者综合能力要求极高。 未来展望: 数字人未来有很多应用场景,如家庭中的数字人管家、学校中的数字人老师、商场里的数字人导购等。未来还会有很多技术突破,如将五感数据和躯壳控制参数作为输入,次世代算法可自我迭代升级和自行演化躯壳控制方式。通过 Dify 搭建数字人的开源项目可展现低门槛高度定制数字人的基本思路,数字人的核心在于 Agent 即灵魂,如何在 Dify 上编排专属数字人灵魂值得体验。期望随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,AI 既能提供高质量信息,也能关注用户情绪。
2025-04-14
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-04-12
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
数字人讲解产品
以下是关于数字人讲解产品的相关内容: 电商方面: 1. 添加产品/介绍背景:若有自己的视频/图片素材可用,若无,可根据搜索添加。 2. 扣像结合背景:在剪映中把数字人扣下,导入视频,点击画面选择抠像,点击智能抠像,调整大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索或手动添加喜欢的音乐。最终形成所需视频,可用于带货或讲解产品,也能应用于直播(直播可能收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版)。 XiaoHu.AI 日报 1 月 14 日相关: 1. 无需真人模特,上传产品图片,数字人即可手持产品进行口播展示。 2. 支持语音和口型同步,动作、姿势可定制,提供 1000+多国家数字人模特。 3. 覆盖全球 28+种语言,能快速生成产品宣传视频,省去拍摄烦恼。测试视频效果接近成熟,嘴型部分仍需微调。在线体验:
2025-04-11
风格化mj提示词
以下是关于 Midjourney 风格化提示词的相关内容: 仿照 GPTs 里的 MJ prompt 改的提示词可用于 coze 或其他国内的 agent。MJ 对节点无要求,画插图可不切节点,不挑模型,提示词可让 agent 补全润色。例如:“一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格”的提示词为“A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6”。 Midjourney V6 更新风格参考命令 2.0“sref”,常见问题如想要的新图像和 sref 图像差异大时,MJ 给出了三种办法: 修改提示:语义细节太多时,编写提示用可取细节替换不需要的;风格不够时,修改提示使其更符合追求的风格。 更改“sw”值:语义细节太多时,将“sw”从默认值 100 降低;风格不够时,将“sw”从默认值 100 提高。 使用小权重强调或弱化不需要的画布元素。 参数总览与举例: “No 否定提示”:在提示词末尾加上“no”可让画面中不出现某些内容,如“no plants”表示图像中不出现植物。 “Quality 生成质量”:在提示词后加上“quality”或“q”参数可更改生成图像花费时间和质量,高质量需更长处理时间和更多 GPU 分钟数。 “Seeds 种子值”:MJ 依靠噪点团起点“Seed”创建视觉噪音场生成初始图像,每个图像种子值随机生成,可指定,v4 模型中相同种子值和提示词产生相同图像结果,可用于生成连贯一致的人物形象或场景。 “Stylize 风格化”:使用 stylize 参数可让 Midjourney 生成更具艺术色彩、构图和形式的图像,低风格化值生成的图像与提示密切相关但艺术性较差,高风格化值产生的图像艺术性强但与提示关联性少,AI 自由发挥空间大。
2025-04-11
有没有那种可以模仿抖音百万博主爆款文案的写作风格以及写作模板的AI
以下是一些关于模仿抖音百万博主爆款文案写作风格和模板的 AI 相关内容: 1. 画小二:Coze 工作流提供了一系列针对抖音热门视频转小红书图文的配置,包括整体结构图、各模块参数配置(如开始模块、Get_Video 模块、LinkReaderPlugin 模块、标题大模型、内容大模型、图片 Prompt 大模型、文生图 ImageToolPro 模块等)的详细说明。同时,在小红书标题和正文写作方面,具备多种技能,如采用二极管标题法创作吸引人的标题,产出口语化、简短且含适当 emoji 表情和 tag 标签的 200 字左右正文。 2. 夙愿:介绍了使用 GPT 模仿创作内容的万能思路,特别是在 Prompt 编写中的数据清洗部分。指出对标博主的文案模板化,数据清洗有人工和自动两种方法,推荐使用 GPT4 的数据分析器进行自动清洗。 3. AIIP 共学模版自媒体全域运营:包含对标笔记的详细信息,如标题、作者、详情、账号、主页、封面、视频、文案等。以“Deepseek+即梦,包装设计步骤来啦”为例,介绍了利用 Deepseek 和即梦进行设计的步骤,并表示希望对用户有帮助。
2025-04-11
文章风格提取
以下是关于文章风格提取的相关内容: 该提示词用于抽取不同风格文章的核心要素,抽取到的字段可作为 prompt,结合指定主题进行风格迁移。整体创作思路见文末 PDF。 具体使用方法为:拷贝文章风格提取提示词,输入给任意大模型,随后提供要抽取的文本。 已抽取的一些风格参考包括万维钢风格、史铁生《我与地坛》文风、李娟《我的阿勒泰》文风、许倬云《说中国》文风、鲁迅《狂人日记》文风、王小波《万寿寺》文风、飞书多维表格工作流自动化抽取等。 使用 DeepSeek V3 进行实验时,智能体地址为 https://www.coze.cn/s/VM9pUn9HdmA/ 。初级使用方法是输入公众号文章标题或内容,智能体会自动提取相关信息,默认风格是“炫彩”。高级使用方法需按照要求输入几个要素,如标题、副标题、分享封面、标签、风格等。
2025-04-11
你是否可以通过照片生成乐高风格人像
可以通过照片生成乐高风格人像。例如,可以使用相关的工具和技术,像在一些图像生成软件中,通过输入照片并设置相关的风格参数,如选择乐高风格,来实现生成。同时,在生成过程中可以像指挥设计师一样,与工具进行反复交流,对不满意的地方进行修改调整。广义上的像素艺术还包括立体像素艺术(类似乐高那种),相关的咒语关键词如“Pixel art”,生成思路可以是一家像素艺术风格的餐厅等。但需要注意的是,某些工具可能无法创建真正的纯净矢量图像的像素艺术,只是将图像“像素化”的像素艺术。
2025-04-11
扣子如何改变回复的语言风格
要改变回复的语言风格,可以参考以下方法: 1. 对于风格类的 Bot,提示词中的 Fewshot 对输出风格影响较大,可先找预期相关人的风格示例并修改。 2. 在 Examples 里使用特定开头的词,如“Fword”,开头字符会显著影响输出内容。 3. 加星号的部分代表加粗,根据自注意力机制可提升提示词中的关键词效果。 4. 能力方面可使用自带的 Bing 搜索和图片识别,根据需求选择,如避免 Webpilot 以免语气变温和。 5. 可根据需求决定是否加入绘画功能。 6. 防护词可参考,但没有完美的防御提示词。 7. 回复风格可来自自己的群聊机器人的风格嫁接。 8. 最后加入一些小 Tips 进一步提升个性化效果。 在场景方面,可以问 Bot 对内容的看法,或让其帮忙分析事情以获得更接地气的表述。 另外,编写提示时: 简单任务场景: 设定人物,描述 Bot 所扮演的角色或职责、回复风格。 描述功能和工作流程,约定 Bot 在不同场景下的回答方式,强调调用工具以保证回复准确性,也可为 Bot 提供回复格式示例。 指示 Bot 在指定范围内回答。 复杂任务场景:推荐使用结构化格式编写提示,扣子支持将 Bot 的提示自动优化成结构化内容,可直接使用或修改。
2025-04-09
吉卜力风格的生成是哪个ai
以下 AI 工具可以生成吉卜力风格的图像: Midjourney:仿照 GPTs 里的 MJ prompt 改了一版提示词,可以用在 coze 或者其他国内的 agent 里。不是很挑模型,基本上都可以用。方便的地方在于如果提示词懒得写全,可以让 agent 直接帮助补全润色,黏贴就可以。例如生成一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格的提示词为:A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6(画面需要改成了 niji) Sora:生成过左半部分为超现实主义风格,细腻刻画皮肤纹理与光影变化,右半部分为吉卜力动画风格,柔和笔触呈现幻想世界魅力的震撼图像。
2025-04-08