Chat with Wiki - 让图片开口说话

Answer

以下是一些让图片开口说话的方法和相关信息：

可以使用一键数字人的好用小工具来实现让照片开口讲话。
实战教程方面，可使用 SadTalker 让照片说话。在图片预处理方式中，crop 只截取图片头部，full 保留整张照片，下面的勾选项有文字解释，可自行尝试。点击 generate 后，由于涉及到视频的推理和转换，输出时间远大于 AI 绘图和 sovits 的声音推理，需做好等待准备。例如导入 13 秒的音频，预计需要 3 - 5 分钟（3060 12g 显卡）。最终生成的视频长度与音频一致，若想制作长视频，最好剪成小段分别推理再合并。完成后可打开输出目录或下载视频文件查看效果。带面部修复会有不同效果。
SadTalker 是利用目前主流的开源程序让照片说话唱歌，达到基本的唇形同步。其相关链接如下：
- GitHub 地址：https://github.com/OpenTalker/SadTalker
- 视频教程：https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122
- 对于编程、python、conda 不熟悉的，可使用整合包：用夸克网盘分享的「EZ-AI-Starter-v0.9.8.zip」，链接：https://pan.quark.cn/s/1d5ca9f57f5c ；视频地址：https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.search-card.all.click&vd_source=35e62d366d8173e12669705f7aedd122 。具体步骤为：点我启动，在启动界面中选择音频、图像口型同步的下载图标，下载完毕后启动应用，会弹出独立窗口（非默认浏览器），选择 SadTalker 同步器，分别导入图片和声音。

Content generated by AI large model, please carefully verify (powered by aily)

References

想让照片开口讲话嘛？害怕麻烦？不会用AI？看看一键数字人的好用小工具！

图片预处理方式中，crop只截取图片的头部，full就是保留整张照片，下面的勾选项已经有文字解释，自己可以试几次点击generate由于涉及到视频的推理和转换，输出时间要远远大于ai绘图和sovits的声音推理，做好等待的准备。下图中，我导入了一个13秒的音频，预计需要3-5分钟（3060 12g显卡）最终生成的视频长度与音频一致，如果想制作一个长视频，最好是剪成小段，分别推理，然后合并。完成后，可以打开输出目录或者下载视频文件。看看效果带面部修复的效果：

实战教程：使用Sadtalker让照片说话

利用目前主流的开源程序让照片说话唱歌，达到基本的唇形同步https://github.com/OpenTalker/SadTalker可以独立使用或者作为插件放入stablediffusion视频教程https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122但是对于编程、python、conda不熟的，强烈建议使用这个整合包：史上最炸裂版AI工具箱来啦，SD-AI绘画、VITS文本转语音，wav2lip、sadTalker唇型同步，视频修复，支持A卡！我用夸克网盘分享了「EZ-AI-Starter-v0.9.8.zip」，点击链接即可保存链接：https://pan.quark.cn/s/1d5ca9f57f5c视频地址：https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.search-card.all.click&vd_source=35e62d366d8173e12669705f7aedd122具体步骤如下：点我启动，在启动界面中，选择音频、图像口型同步的下载图标：下载完毕后如下：启动应用，等待会弹出一个独立的窗口（而不是你的默认浏览器）选择sadtalker同步器，分别导入图片和声音，