Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何制作实时带货数字人,并能 回答观众的问题

Answer

制作实时带货数字人并能回答观众问题可以通过以下步骤实现:

  1. 创作数字人脸:
    • 方式一:使用一系列逼真的照片或插图人脸,这些人脸经过优化,在添加语音和动作时能实现最佳效果。
    • 方式二:上传自己、朋友或家人的面部照片进行创作。
    • 方式三:利用 D-ID 自带的 Stable Diffusion 的能力生成想象中的人脸,例如描述“一个外星女神”“一个微笑的十九世纪维多利亚绅士”等。
    • 无论哪种方式,数字人像添加到人脸库后可重复使用,输入新脚本即可让其说指定的话。
  2. 生成虚拟数字人短视频:
    • 第一步:打开网站(需科学上网)https://studio.d-id.com/editor 。
    • 第二步:输入内容选项,在右侧文字框输入从 ChatGPT 产生的内容,还可更换想要的头像,选择不同的国家和声音。
    • 内容和人像选择好后,点击右上角的 Create Video,等待生成。
  3. 生成数字人:
    • 书架图片会在视频轨道下添加新轨道。
    • 为让图片在整个视频播放时都显示,点击轨道最右侧竖线向右拖拽至视频最后。
    • 背景图片所在轨道若未选中,鼠标点击选中,在显示区域拖动背景图的角将图片放大到适合尺寸,并将数字人拖动到合适位置。
    • 增加字幕:点击文本-智能字幕-识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。
    • 数字人视频完成后,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,则需要用另一个工具进行换脸。
Content generated by AI large model, please carefully verify (powered by aily)

References

电商:带货本地生活

第一种,可以使用一系列逼真的照片或插图人脸来创造。所有人脸都经过优化,可以在添加语音和动作时实现最佳效果。第二种,上传自己的照片,可以是自己的面部、朋友或家人的面部照片就可以创作了第三种,利用D-ID自带的Stable Diffusion的能力生成您想象中的任何人脸。简单讲,你可以描述下你想要的这张脸长啥样,比如“一个外星女神”,“一个微笑的十九世纪维多利亚绅士”等等,它马上可以生成你长你想要的脸。不管用哪种方式,一旦这个数字人像被添加到人脸库里,你就可以随意重复使用它。只需输入新的脚本,就可以让这个数字人像说任何你想让他说的话。瞧,这就是用一些历史名人的肖像画生成的对话,剪辑成有剧情的短视频就非常有趣,里面就有我喜欢的李白吟诗,目前该博主在B站点赞已经超过1000万,只有你想不到,没有你做不到。

电商:带货本地生活

第一步:打开网站(要科学),如下图:https://studio.d-id.com/editor第二步:输入内容选项,首先可以在右侧的文字框里面,输入我们从ChatGPT那边产生出来的内容,然后也可以换你想要的头像,如下图:还有可以选择不同的国家和声音,如下图内容和人像都选择好了之后,点击右上角的Create Video,如下图:点击generte之后,等一段时间生成好数字人视频生成好了,接下来只需要结合产品做讲解即可发布去做视频带货啦

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

此时,书架图片就会在视频轨道的下面,添加一条新轨道:为了让图片在整个视频播放的时候都显示,可以点击这个轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐:此时,背景图片所在的轨道是选中状态。如果没选中,鼠标点击一下这个规定即可。在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置:3.3增加字幕点击文本-智能字幕-识别字幕,点击开始识别:软件会自动将文字智能分段并形成字幕:至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果你希望数字换成自己希望的面孔,比如这个:就需要用另一个工具来进行换脸了。

Others are asking
使用ai绘图能够将带货产品批量换背景,使用在小红书社区
以下是一些能够为带货产品批量换背景并应用于小红书社区的人员信息: 卡飞猫:15692004031,擅长摄影写真、banner 生成、替换产品。 韩君奇:13060035786,能够批量出图,做小红书种草。 阿鱼:18102592057,擅长各种类型的 AI 画图,以及 AI 视频提效。 吴燕波:15766104311,可进行日常出图,视频等。
2025-03-18
我是美区Tiktok shop 的卖家,希望AI用图片生成带货短视频
以下是利用 AI 用图片生成带货短视频的步骤: 1. 添加产品/介绍背景:如果有自己的视频/图片素材,可以直接使用;若没有产品背景/产品介绍,可以根据搜索添加。 2. 扣像结合背景:在剪映里面把数字人扣下来,导入视频,点击画面选择抠像,点击智能扣像,调整到合适的大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索添加音乐或手动添加自己喜欢的音乐。 这样就可以根据您的需求结合您的图片生成您需要的视频,用于带货或讲解产品。如果应用在直播也是可以的,把视频做长些即可,但直播可能需要收费,短视频可以通过购买邮箱注册使用免费的时长或直接购买会员版。
2025-03-17
我是美区Tiktok shop 的卖家,希望使用AI生成带货短视频
以下是使用 AI 生成美区 TikTok Shop 带货短视频的步骤: 一、用 ChatGPT 生成短视频选题文案 表明身份,描述需求并提出回答要求,以美妆行业为例展开。 二、用 ChatGPT 生产短视频文案 将需求与框架结合,让 ChatGPT 为您生成短视频文案。 三、生成虚拟数字人短视频 1. 打开网站(需科学上网):https://studio.did.com/editor 2. 在右侧文字框输入从 ChatGPT 产生的内容,选择想要的头像。 3. 选择不同的国家和声音。 4. 内容和人像选择好后,点击右上角的“Create Video”,等待生成。 四、虚拟数字人结合产品做视频 1. 添加产品/介绍背景 若有自己的视频/图片素材可直接使用,若无,可根据搜索添加。 2. 扣像结合背景 在剪映中把数字人扣下来,导入视频,点击画面选择抠像,点击智能扣像,调整到合适的大小和位置。 3. 添加字幕和音乐 智能识别字幕。 可搜索添加音乐或手动添加喜欢的音乐。 这样就可以根据您的需求结合图片生成所需的视频,用于带货或讲解产品,也可应用于直播(直播可能收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版)。
2025-03-17
生成电商带货视频
以下是生成电商带货视频的详细步骤: 一、用 ChatGPT 生成短视频选题文案 1. 表明身份 2. 描述需求 3. 提出回答要求,以美妆行业为例展开 二、用 ChatGPT 生产短视频文案 将需求与框架结合,让 ChatGPT 为您生成短视频文案 三、生成虚拟数字人短视频 1. 第一步:打开网站(要科学)https://studio.did.com/editor 2. 第二步:输入内容选项,在右侧文字框输入从 ChatGPT 产生的内容,可更换想要的头像,选择不同的国家和声音 3. 第三步:点击右上角的 Create Video,等待生成 四、虚拟数字人结合产品做视频 1. 第一步:添加产品/介绍背景,可使用自己的视频/图片素材,也可根据搜索添加 2. 第二步:扣像结合背景,在剪映中把数字人扣下来,导入视频,点击画面选择抠像,点击智能扣像,调整到合适的大小和位置 3. 第三步:添加字幕和音乐,智能识别字幕,可搜索添加音乐或手动添加喜欢的音乐 此外,还有以下相关信息: 《AI 数字人上岗,带货本地生活电商,一个月多赚 3 万》的案例,教程详细,来自生财项目社:https://mp.weixin.qq.com/s/OIjVIV2Hv0xV6eFU9m6ngw AnchorCrafter 是打造“电商带货”风格视频的利器,强调人物互动,优化细节表现,输出多样性提升。详细介绍:
2025-03-17
AI数字人直播带货
以下是关于 AI 数字人直播带货的相关信息: AI 数字人直播盈利方式: 1. 直接销售数字人工具软件,包括实时驱动和非实时驱动两类。实时驱动的标准零售价一年在 4 6 万往上,非实时驱动的一个月约 600 元,效果差且市场价格混乱。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路和调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果较好,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上无壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 2. 不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司,因其只是工具,迁移成本低。 3. 真正把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜、不考虑客户效果的公司,售后问题麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映若不仅提供数字人,还提供货品供应链、数据复盘分析等全环节服务,会绑定商家,竞争难度大。 数字人简介: 数字人是运用数字技术创造出来的,虽现阶段不能高度智能,但在生活场景中已常见,且随 AI 技术发展迎来应用爆发。业界尚无准确定义,一般根据技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,应用于影视和直播带货等,表现质量与建模精细度及动捕设备精密程度相关,现视觉算法进步,无昂贵动捕设备也能通过摄像头捕捉关键点信息达到不错效果。 AI 数字人类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(柳夜熙)、内容创作等。 2. 真人形象数字人:用于直播卖货,营销/投流广告视频录制、语言学习等。 AI 数字人的价值: 1. 代替人说话,提升表达和营销效率,如真人无法 24 小时直播,数字人可以。 2. 创造真实世界无法完成的对话或交流。 AI 数字人面临的问题: 1. 平台限制:数字人水平参差不齐,平台担心直播观感,有一定打压限制,如抖音出台标准,微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间依赖大模型技术提升。 3. 需求限制:直播带货算落地场景,但不刚需,更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,如换脸、数字永生等。
2025-03-06
AI结合小绿书带货
AI 结合小红书带货有多种方式和成功案例: 1. 用 AI 制作服装:如 AI 小绿裙,单价 239 卖了 1160 多份,销售额达 27 万。制作方式多样,熟练者可用 sd 或 mj,新手可用 mewxai 或幻火。 2. 用 AI 定制萌娃的头像:单价 19.9,卖了 2675 份。执行力强的人靠此每月能有 2000 3000 的收入,也有人把单子转给别人做自己抽成。 3. 还有其他案例,如“电商:带货本地生活”中提到的 AI 数字人上岗带货本地生活电商,一个月多赚 3 万;“电商:婴儿的四维彩超 AI 预测”通过 AI 工具提前还原宝宝的四维彩超进行变现。
2025-01-26
实时翻译视频语音
以下是为您整理的相关信息: 实时翻译视频语音的工具: StreamSpeech:这是一个实时语言翻译模型,能够实现流媒体语音输入的实时翻译,输出目标语音和文本,具有同步翻译、低延迟的特点,还能展示实时语音识别结果。 给视频配音效的 AI 工具: 支持 50 多种语言的配音,音质自然流畅,提供实时配音功能,适用于直播和演讲,能将语音转录为文本,方便后期字幕制作和编辑。 Vidnoz AI:支持 23 多种语言的配音,音质高保真,支持文本转语音和语音克隆功能,提供语音参数自定义和背景音乐添加工具,提供面向个人和企业的经济实惠的定价方案。 在选择视频配音工具时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。
2025-04-07
ten可以安装在电脑里,然后电脑上可以看视频进行实时翻译吗?这个功能可以怎么去实现?
目前 Ten 不太明确是指何种具体的软件或工具。一般来说,如果您想在电脑上实现观看视频实时翻译的功能,可以考虑使用以下几种常见的方法: 1. 利用浏览器插件:例如谷歌浏览器的某些翻译插件,能够在您观看在线视频时提供翻译服务。 2. 专业的翻译软件:部分专业的翻译软件具备屏幕取词和实时翻译视频的功能。 3. 操作系统自带的功能:某些操作系统可能提供了相关的辅助功能来实现类似的效果。 但需要注意的是,不同的方法可能在翻译的准确性、支持的语言种类以及适用的视频平台等方面存在差异。
2025-03-25
需要一个能在看YouTube英语视频的时候把每句话都实时翻译成中文 挂在字幕上的ai工具
以下为您推荐一款可能满足您需求的 AI 工具:Memo AI (https://memo.ac/zh/)。它可以对 YouTube、播客、本地音频视频轻松进行转文字、字幕翻译、语音合成,还可以由多种 AI 模型提炼内容精华总结,生成思维导图。并且支持中文、英语等多语言。
2025-03-19
帮我编程一个AI实时翻唱的软件
目前要编程一个 AI 实时翻唱的软件是一项非常复杂的任务,涉及到多个领域的知识和技术,包括语音合成、音频处理、机器学习、深度学习等。 首先,需要收集大量的原唱音频数据用于训练模型。然后,利用深度学习算法,如循环神经网络(RNN)、长短时记忆网络(LSTM)或 Transformer 架构,来学习原唱的特征和模式。 在语音合成方面,可能会用到诸如 WaveNet、Tacotron 等技术,以生成逼真的歌声。 音频处理则用于对生成的歌声进行优化和调整,例如去除噪音、增强音质等。 然而,要实现这样一个复杂的软件,需要具备深厚的编程和算法知识,以及大量的计算资源和时间来进行模型的训练和优化。
2025-03-13
实时驱动 ai直播
以下是关于实时驱动 AI 直播的相关信息: AI 数字人直播盈利方式: 1. 直接销售数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人可接管,市面价格一年 4 6 万往上(标准零售价)。非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料,不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路及调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播效果最好的是店播,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上没壁垒,但目前仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高,如更真实的对口型、更低的响应延迟等。 2. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司,因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。 虚拟主播在电商直播间的情况: 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但由于技术尚未达到真人直播的水平,所以通常只在午夜时段排期。阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),其中每个店铺视为一路,该服务提供多种功能。虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设了丰富的动作库和真实的语音表现,但商品展示以图片为主,虚拟主播无法与产品有接触,纯粹只能动嘴皮,商品只能放在一旁,这样的测评结果缺乏真实性,容易引起用户反感。目前,AI 驱动的虚拟主播更像是一个花瓶,能够吸引一些好奇的用户,再负责一些基础性的产品介绍和互动问答。 11 月 11 日和 10 日的 AI 相关动态: 11 月 11 日:Google 在 iPhone 上测试独立的「Google Gemini」应用,新应用支持 iOS 用户使用 Gemini Live,通过语音命令与 AI 互动,功能类似 ChatGPT 的高级语音交流。包含视觉识别功能,并已在 2024 年 9 月对 Android 用户开放,预计将随 Gemini 2.0 的发布正式上线。 11 月 10 日:Google 发布 Gemini AI 驱动的视频演示工具 Vids,通过简单提示或 Google Drive 文档,自动生成视频故事板,包含场景、脚本和背景音乐。支持语音旁白和滚动式提词器,便于自然流畅的录制,应用于客户支持、培训视频、公司公告、会议回顾等多种场景。NVIDIA AI Blueprint 是长视频内容总结与问答解决方案,能快速总结数小时视频的关键事件和对话,省去逐帧观看的时间,支持长视频的搜索、问答和实时事件检测,适用于监控、教育、客户服务等场景,为开发者提供构建视频理解和摘要功能的框架。
2025-03-11
视频实时翻译
以下是为您提供的关于视频实时翻译的相关信息: 在官方发布的视频中,GPT 能够帮助英语用户和西班牙语用户进行实时翻译,取代了翻译官的角色,准确清晰地表述用户想要表达的内容。 StreamSpeech 是一种实时语言翻译模型,能够实现流媒体语音输入的实时翻译,输出目标语音和文本,具有同步翻译、低延迟的特点,并能展示实时语音识别结果。
2025-03-06
剧本分析(NLP):AI 读取剧本,分析情节、角色发展,甚至预测观众反应。
以下是关于剧本分析(NLP)中 AI 读取剧本并进行相关处理的一些信息: 人物剧本与角色状态: 对人物如李洛云进行“剧本推演”,每天生成 20 40 个时间段剧本,依据人物背景和增长记忆体生成。 可使用 LLM 生成英文提示词用于 Stable Diffusion 出图,图存于“手机相册”用于对话多模态中的图片回复。 选择剧本和图片生成朋友圈文案。 拟人行为: 反感度系统:通过 LLM 分析对话判断角色是否产生反感度。 延迟回复:根据状态忙闲或是否睡觉决定回复时间。 接受多轮输入,一并回复:避免每一条输入回复一句,不像真人。 响应拆分与响应延迟:将一大段响应文本拆分成多段,模拟人类打字速度(3 5 字/秒),回复时概率性使用表情包,有概率主动聊天(与亲密度正相关)。 微信朋友圈:根据每天人物剧本挑选 1 2 个发布朋友圈并配图,目前内容由 AI 生成但手工发布。 将小说做成视频的制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 2. 生成角色与场景描述:用工具(如 Stable Diffusion 或 Midjourney)生成视觉描述。 3. 图像生成:用 AI 图像生成工具创建图像。 4. 视频脚本制作:将关键点和图像组合成脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)转换语音,添加背景音乐和音效。 6. 视频编辑与合成:用视频编辑软件(如 Clipfly 或 VEED.IO)合成。 7. 后期处理:剪辑、添加特效和转场提高质量。 8. 审阅与调整:观看视频并根据需要调整。 9. 输出与分享:完成编辑后输出并分享。 Inworld AI: Inworld AI 是一家专注于游戏和人工智能的初创公司,开发了 Inworld 的 AI 角色引擎,可将游戏 NPC 进行 AI 化并集成到游戏中。该引擎超越大语言模型,增加可配置的安全性、知识、记忆、叙事控制、多模态等功能,使 NPC 能够自我学习和适应,具有情绪智能。其角色引擎可创建具有独特个性和上下文意识的角色,无缝集成到实时应用中,内置优化规模和性能的功能。Character Brain(性格大脑)引擎使 AI NPC 能够学习和适应,具有情绪智能的关系导航能力、记忆和回忆能力,并能自主发起目标、执行动作并遵循动机。功能包括目标和行动、长期记忆、个性、情绪等。
2025-03-20
AI 圆桌论坛,讨论者是通信公司技术专家,数字业务专家,初创企业智慧城市专家,听众是对AI了解相对一般的观众,可以讨论哪些话题
以下是一些适合在您所描述的 AI 圆桌论坛中讨论的话题: 1. AI 在通信领域的应用与挑战,例如如何提升通信网络的智能化、优化频谱资源分配等。 2. 数字业务中 AI 的创新应用和潜在风险,比如个性化推荐系统的优化、数据隐私保护等。 3. 初创企业在智慧城市建设中利用 AI 的机遇和困难,像是如何获取数据资源、应对技术人才短缺等。 4. 探讨具身智能在不同领域的发展前景,如机器人、教育等。 5. 大模型如何为具身智能带来变革,以及相关的技术突破和应用案例。 6. 分析 AI 对传统行业的冲击与重塑,以及如何应对这种变化。 7. 研究 AI 在教育领域的创新模式,如个性化学习、智能辅导等。 8. 讨论 AI 技术的监管政策和伦理道德问题。 9. 分享在不同场景下(如出海业务、创新教育等)AI 的应用经验和成果。 10. 展望 AI 未来的发展趋势及其对社会经济的影响。
2024-10-20
如果制作智能体
制作智能体的方法如下: Logo 设计智能体: 江树提供了提示词模板,使用方法为将品牌、行业、理念等信息替换成自己的,复制到 GPT4o 中,即可瞬间呈现高质量 Logo。 若想进一步提升设计效果,可使用江树设计的 Logo 智能体生成更精准的提示词,访问链接 https://chatgpt.com/g/g67f4bf538f9081918073af13ba5c2cfelogodesigner ,生成的提示词可直接复制到 GPT4o 中,并借助最新的 AI 绘图能力达到专业设计水准。 Coze 智能体(字段捷径)获取笔记+评论信息: 第一步,创建一个智能体,使用单 Agent 对话流模式。 第二步,编排对话流,点击创建新的对话流(记得要和智能体关联)。 第三步,在获取笔记详情节点和笔记评论节点分别配置 cookie,note_link 使用开始节点的 USER_INPUT。 第四步,使用代码节点进行数据处理,注意代码节点输出的配置格式。 第五步,测试。找到一篇小红书笔记,试运行对话流,直接在对话窗口输入地址,看到数据即为成功。回到智能体的编排页面,同样方式测试,确保对话流执行成功。 第六步,发布。点发布后只选择多维表格,然后点配置。输出类型选文本,输入类型选择字段选择器。完善上架信息,填个表格,选发布范围时可选仅自己可用以加快审核。提交上架信息后,返回配置界面显示已完成即可完成最终提交。 其他智能体: 如创建一个输入人设等信息的智能体,放上已创建的工作流。但注意工作流中若有消耗个人资源的部分,如【所有视频片段拼接】节点使用的插件 api_token 填的是个人 token,不能直接发布。可将 api_token 作为工作流最开始的输入,用户购买后输入 api_token 再发布。
2025-04-14
最好的制作ppt的大模型是哪个
目前在制作 PPT 方面,没有绝对的“最好”的大模型。例如,Claude 3.7 在将 PDF 转换为 HTML 方面效果较好,但国内用户使用不太方便,可改用 DeepSeekR1 实现。某上市公司使用某互联网大厂研发的千亿 AI 大模型产品声称能 3 分钟制作 PPT,但接入公司系统时出现“一连接就死机”的情况。同时需要注意的是,过去几个月内国内的 AI 大模型在某些方面大同小异,且大部分远未达到可商用化程度。
2025-04-13
AI 制作短视频的方法
以下是关于 AI 制作短视频的方法: 1. 确定视频风格和主题:使用 Fanbook 中的 niji6 模型及sref 指令,加上每张图片的提示词来确定视频风格的一致性。比如根据丝绸之路的古风主题确定风格和时长,然后设定故事主线和镜头。 2. 创作故事剧本和分镜头:参考分镜头的基本格式要求,按照场景、地点、镜号、画面描述、台词、音效等维度进行填充。尽可能精简人物对话,提炼重点。当缺乏画面灵感时,可以借助语言大模型,如 Kimi 来获取帮助。 3. 生成角色和场景:根据剧本中的人物性格特征和时代背景,描绘人物的提示词、上传角色参考图cref,并将角色背景扣除以便于进行角色加背景的融合生成时进行垫图操作。场景提示词从剧本中的画面描述进行提取,采用文生图模式,画面风格选择提前准备好的风格图进行垫图,上传角色图、场景背景进行参考生成,提高人物和场景的融合度。 4. 让图片动起来:使用即梦进行图生视频,上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,可生成时长为 3 秒钟的画面。运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度根据视频节奏选择。 此外,根据视频脚本生成短视频的 AI 工具有多种,适用于不同的应用场景和需求,包括: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户提供文本描述来生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-13
我想通过AI制作H5页面
以下是关于通过 AI 制作 H5 页面的相关信息: AI+高德 MCP 可以帮助您制作 H5 页面。目前,该工具已经有 1000 多人进行制作,还有几十位同学已经发出了自己的产品。 这次更新带来了三个超级实用的功能: 1. 24 种超酷的 H5 风格可供选择,如同选衣服一样简单。 2. 具备一键导航功能,无需复制粘贴地址。 3. 数据更真实,不用担心 AI 瞎编。 使用这些功能,10 分钟就能全部搞定。 在上期文章《》中,详细讲解了获取高德地图的密钥、cursor 如何设置 MCP、询问高德 MCP 生成旅游信息以及美化页面展示等内容。如果您还未阅读,可以点击查看。 另外,使用 Cursor 制作主页的步骤如下: 在搞定一个简单小游戏后,可以做个人介绍网站。假设要做一个《全 AI 自动驾驶的火星登陆飞船》项目,首先要有初步的项目介绍,然后新建一个相关文件夹并打开,在 AI 对话框中输入介绍内容,等待 AI 制作并加入修改意见。 若想让别人看到您的作品预览,可以通过网站 https://www.yourware.so/ 将项目文件夹整体上传,生成临时浏览链接,在不需要域名和服务器的情况下让外部看到作品。如果发现 cursor 卡顿,注意是否需要在终端区或者对话区确认重要操作,可将左下角的 ask every time 修改为 auto run 实现全自动化。
2025-04-13
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
如何使用AI制作真人表情包?
以下是使用 AI 制作真人表情包的方法: 1. 使用 Gemini 2.0 Flash: 场景:表情包在社交媒体中是不可或缺的表达工具,但制作个性化表情包对许多人来说并不容易,有的工具可以生成根据某一个主体生成不同的表情,但是生成出来的图会多多少少改变原主体。 实用性:用户只需上传一张主体图片(例如一个小女孩的照片),通过简单的自然语言指令(如“让她开心大笑”),Gemini 就会自动生成相应的表情图片。 指令:“生成 XXX + XXX 的表情” 2. 使用 ChatGPT 4o: 输入提示词并加上最初的真人图片,例如:创建图片:一个戴着深蓝色蝴蝶结领结的柴犬,表情参考我上传的图片,3D 风格,毛绒绒质感,不要太逼真,比例为 1:1。如果对生成的第一个表情不满意,可以重新输入指令进行调整,如“让它看起来得意一点”。 一次生成九宫格表情包的方法:先收集很多自己喜欢的表情包,将每组拼图为 9 个,然后将先前做好的真人原图和一张九宫格拼图一起上传到 4o 对话框,输入相应指令,如:创建图片:参考图二的动作和道具制作表情包九宫格,每个图案都替换为图一为主角,保持风格为图一的质感,整整齐齐无留白排列,颜色明亮不偏黄,文字内容仔细核对不要出错。 另外,有的地方需要上传封面图,也可以由 4o 生成,先要求它做一个比例约 3:2 的。如果有个很喜欢的表情,使用九宫格出的效果不好,也可以单个一个个去生成,但比较费时间,且可能会受出图限制等待更久。最后将所有图片下载下来,挑选出需要的表情图片。
2025-04-11