Chat with Wiki - 声音克隆然后朗读文章

Answer

声音克隆然后朗读文章的相关信息如下：

声音克隆主要由 SenseVoice 和 CosyVoice 模型构成。仅需几秒音频样本即可进行声音克隆，无需额外训练数据，还能控制情绪情感、语速、音高。

相关链接：

详细内容：https://xiaohu.ai/p/10954
项目地址：https://fun-audio-llm.github.io
在线演示：https://modelscope.cn/studios/iic/CosyVoice-300M
https://x.com/imxiaohu/status/1810239744812679271

开源的数字人组合方案中，声音克隆的步骤如下：第一步，先剪出音频，使用 https://elevenlabs.io/speech-synthesis 或使用 GPT-sovits（GPT-SoVITS 实现声音克隆）https://waytoagi.feishu.cn/wiki/SVyUwotn7itV1wkawZCc7FEEnGg 克隆声音，做出文案的音频。第二步，使用 wav2lip 整合包，导入视频和音频，对口型得到视频。基础 wav2lip+高清修复整合包下载地址：https://github.com/Rudrabha/Wav2Lip 。这就是目前的本地跑数字人的方案，效果都差不多，都是用的 wav2lip。相关产品：https://synclabs.so/

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?它由主要模型构成：SenseVoice和CosyVoice。声音克隆仅需几秒音频样本无需额外训练数据控制情绪情感、语速、音高?详细内容：https://xiaohu.ai/p/10954?项目地址：https://fun-audio-llm.github.io?在线演示：https://modelscope.cn/studios/iic/CosyVoice-300M?https://x.com/imxiaohu/status/18102397448126792715⃣?LLM比价工具?可以选择不同种类的模型型号?对其订阅价格和API价格进行对比?选择最适合你的模型?传送门：https://huggingface.co/spaces/philschmid/llm-pricing?https://x.com/imxiaohu/status/1810316837546344648⑥?浦语灵笔IXC-2.5：能看懂视频，完整书写文章。自动生成网站的多模态模型。由上海人工智能实验室开发，使用7B LLM后端。与GPT-4V相当的能力。擅长网页制作和高质量文本-图像文章创作。?详细内容：https://xiaohu.ai/p/10891

XiaoHu.AI日报

开源：数字人组合方案

先剪出音频，使用https://elevenlabs.io/speech-synthesis或使用GPT-sovits[GPT-SoVITS实现声音克隆](https://waytoagi.feishu.cn/wiki/SVyUwotn7itV1wkawZCc7FEEnGg)克隆声音，做出文案的音频。[heading2]第二步[content]使用wav2lip整合包，导入视频和音频，对口型得到视频。基础wav2lip+高清修复整合包下载地址https://github.com/Rudrabha/Wav2Lip这就是目前的本地跑数字人的方案，效果都差不多，都是用的wav2lip产品https://synclabs.so/