Chat with Wiki - 额，我想问下关于数字人相关的解决方案

Answer

以下是关于数字人的相关解决方案：

摊位信息方面：包括 AI 肖像及写真、AIphone 创意手机壳、AI 照片转动漫、AI 如意写真、AI 数字人短视频和直播、爱原物 AI 设计、AI 摄影写真、量化 AI 助手应用、AI 玄学+珠宝、阿里无影 AI 云电脑和建筑设计、现场算 AI 塔罗牌等。
算法驱动的数字人：开源代码仓库有 ASR 语音识别（如 openai 的 whisper、wenet、speech_recognition）、AI Agent（大模型有 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等，Agent 部分可用 LangChain 模块自定义）、TTS（如微软的 edge-tts、VITS、so-vits-svc）。人物建模模型可通过手动建模或 AIGC 方式生成人物动态效果。但简单构建方式存在如生成指定人物声音、TTS 音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等问题。
剪映数字人“个性化”方案：剪映作为字节跳动旗下产品，在抖音平台广泛应用，海外版 CapCut 成绩优异。其具有声音克隆和公模数字人能力，搭配 facefusion 换脸技术可实现零成本口播数字人。制作流程为打开剪映，添加文本到文字轨道并修改，点击朗读进行声音克隆，选择数字人形象并换上克隆音色，最后一键智能生成字幕并调整文字样式校准。剪映下载地址：https://www.capcut.cn/ ；capcut 下载地址：https://www.capcut.com 。

Content generated by AI large model, please carefully verify (powered by aily)

References

|你的摊位活动主题和内容|摊位区域|摊位编号|摊位类型||-|-|-|-||AI肖像及写真，包括AI宠物守护肖像、婚纱写真、头像油画肖像|D|46|写真||A Iphone创意手机壳|D|三思边|手机壳||AI照片转动漫，Ai教学设计（杭州云谷）|D|48|教学||AI如意写真,AI创意蛋糕|D|49|写真||AI数字人短视频和直播，现场可以给大家极速克隆。|D|5|产品展示+数字人||爱原物AI设计，轻工消费品创意|D|50|产品演示||AI摄影写真，老照片修复|D|51,52|相片||量化AI助手应用<br>详细函数介绍：提供量化API中各个函数的详细说明和使用示例。<br>策略代码生成：根据您的具体需求，快速生成可用的量化策略代码。<br>错误解决方案：针对Python报错，提供可能的解决方案。<br>优化建议：帮助您优化策略代码逻辑，提升策略性能。|D|54|产品展示||AI玄学+珠宝|A|55|玄学||阿里无影AI云电脑?，AI建筑设计|E|56，57|产品展示||现场算AI塔罗牌，以及售卖AI做的猫猫塔罗牌，可能会有其他的AI文创|D|59|玄学+塔罗牌|

AI 数字人-定义数字世界中的你

上述算法开源的代码有很多，这里列出一些仓库供大家参考：ASR语音识别openai的whisper:https://github.com/openai/whisperwenet:https://github.com/wenet-e2e/wenetspeech_recognition(这是一个语音识别的接口集合，里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognitionAI Agent大模型部分就比较多了，包括ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent部分可以使用LangChain的模块去做自定义，里面基本包含了Agent实现的几个组件(https://www.langchain.com/)TTS微软的edge-tts：https://github.com/rany2/edge-tts，只能使用里面预设的人物声音，目前接口免费。VITS：https://github.com/jaywalnut310/vits，还有很多的分支版本，可以去搜索一下，vits系列可以自己训练出想要的人声。so-vits-svc:https://github.com/svc-develop-team/so-vits-svc，专注到唱歌上面，前段时间很火的AI孙燕姿。除了算法，人物建模模型可以通过手动建模(音频驱动)或者AIGC的方式生成人物的动态效果(例如wav2lip模型)实现，这样就完成了一个最简单的数字人。当然这种简单的构建方式还存在很多的问题，例如：如何生成指定人物的声音？TTS生成的音频如何精确驱动数字人口型以及做出相应的动作？数字人如何使用知识库，做出某个领域的专业性回答？

方案：剪映数字人“个性化“—无限免费私模数字人

大家好！我是卡尔，今天分享的是剪映口播数字人的私有化。PS:视频版本已经在路上，大家敬请期待Heygen的访问限制太强，正好剪映已经有了声音克隆和公模数字人两项能力，搭配facefusion的换脸技术，我们能轻松实现零成本的口播数字人[heading1]剪映做数字人的优势[content]剪映作为字节跳动旗下的产品，在抖音平台上，被广泛应用于短视频的创作和编辑中。剪映海外版CapCut登顶过美国App Store，在全球各国App Store和Google Play平台上的安装总量已超过2.5亿次，在美国市场内的安装总量接近950万次。剪映的“魔力”是什么？我们不妨来盘点一下剪映已有的AI功能这六大AI功能基本上解决了我们用数字人做视频的痛点，不需要反复跳出剪映，在编辑器里就能过完成脚本生成→语音克隆→数字人口播的环节。那下面就让我带大家手把手做一个数字人口播视频剪映下载地址：[https://www.capcut.cn/](https://www.capcut.cn/)capcut下载地址：[https://www.capcut.com](https://www.capcut.com)[heading1]制作流程[content]首先我们打开剪映，然后添加一个文本到文字轨道，并修改好需要朗读的文字；然后点击朗读，并进行声音克隆，剪映的声音克隆现在只用念一句话就可以完成克隆；克隆完成后，选择喜欢的数字人形象，并把自己的克隆音色换上去；最后，一键智能生成字幕，再自行调整文字样式并校准叫完成了。[heading1]成果视频