Chat with Wiki - 数字人可以替代真人直播吗

Answer

数字人在一定程度上可以用于直播，但不能完全替代真人直播。

数字人的优势包括：

能够 24 小时不间断直播，提升表达效率和营销效率。
可以创造真实世界无法完成的对话或交流。

然而，数字人直播也面临一些问题：

平台限制：目前数字人水平参差不齐，平台担心直播观感，有一定打压限制。例如抖音出台一些标准，微信视频号容忍度更低，可能人工检查封号。
技术限制：形象只是皮囊，智能水平和未来想象空间依赖大模型技术提升。
需求限制：直播带货是一个落地场景，但不够刚性。“懂得都懂”的刚需场景，国内难以实现。目前更多是带来体验新鲜感。
伦理/法律限制：存在声音、影像版权等问题，比如换脸、数字永生等。

在电商直播间中，虚拟主播面临的挑战有：

货品展示方面，直播间的特点在于真实性，包括真实的商品展示、试用以及真实的评测，然而这是虚拟主播的致命挑战。比如虚拟网红翎 Ling 的美妆带货翻车案例，没有皮肤问题困扰的虚拟人很难让消费者共情。尽管 SLAM 等 3D 交互技术可以完善数字人与真实空间的交互，但要实现与商品的互动较为困难，更何况用户还希望能够尽可能多的了解到商品的细节。
目前虚拟数字人从技术驱动方式上分为“中之人”驱动和 AI 驱动。“中之人”驱动通过动作捕捉和面部捕捉技术实现虚拟人与现实的交互，成本较高。AI 驱动的虚拟人具备更加自然、智能、人性化的交互能力。

未来，随着技术的发展，或许再过十余载，虚拟主播肉身化，具备了真实的身体，可能真的能在直播间站稳脚跟。同时，MR 设备的普及也可能带动新的一轮技术迭代，为直播带来更加沉浸式的互动购物体验。

Content generated by AI large model, please carefully verify (powered by aily)

References

7月2日张晟、汗青讨论数字人

嘉宾：张晟（来自一线数字人公司）、汗青（B站搜索AI Talk）视频源地址：[AI数字人（虚拟人）讨论总结](https://bytedance.feishu.cn/docx/ZYladJDfrocZOGxylnucJeMXn0b)[heading2]AI数字人类型和应用场景？[content]1.二维/三维虚拟人：用于游戏、IP品牌（柳夜熙）、内容创作（[http://AI.talk](https://t.co/EM7nnuMohc)）等。2.真人形象数字人：用于直播卖货，营销/投流广告视频录制（Heygen）、语言学习（CallAnnie）等等。[heading2]AI数字人的价值是什么？[content]1.代替人说话，提升表达效率和营销效率。比如真人做不到24小时直播，但数字人可以。2.创造真实世界无法完成的对话或交流。例如AI talk的实验探索，复活故去的亲人等。[heading2]AI数字人面临的问题？[content]平台限制：目前数字人水平参差不齐，平台担心直播观感，有一定打压限制。比如抖音出台一些标准，而微信视频号容忍度更低，人工检查封号。技术限制：形象只是皮囊，智能水平和未来想象空间，依赖大模型技术提升。需求限制：直播带货算个落地场景，但不刚。“懂得都懂”的刚需场景，国内搞不了。目前更多是体验新鲜感。伦理/法律限制：声音、影像版权等，比如换脸、数字永生等等。

虚拟主播，能在电商直播间站稳脚跟吗？

直播间的特点在于真实性，其中包括真实的商品展示、试用以及真实的评测，然而这也是虚拟主播面临的致命挑战。比如虚拟网红翎Ling的美妆带货翻车案例，没有皮肤问题困扰的虚拟人很难让消费者共情。尽管SLAM等3D交互技术可以完善数字人与真实空间的交互，但要想实现与商品的互动，则较为困难，更何况用户还希望能够尽可能多的了解到商品的细节。在《2022虚拟数字人综合评估指数报告》中指出虚拟数字人发展的三个阶段：拟人化：由计算机虚拟合成的高度逼真的三维动画人物，动作形态声音等与真人吻合，初步基于AI实现虚拟人驱动，实时进行信息沟通和反馈。同人化：从外观的形态模拟进阶到情感的可交互，情感算法技术实现与人类高质量情感互动。超人化：虚拟人的能力超越自然人，“虚拟”实体化，机器人承载虚拟人意识回到现实世界。或许再过十余载，虚拟主播肉身化，具备了真实的身体，他就真的能在直播间站稳脚跟了。[heading3]场景变幻，无限可能[content]相比于“人”与“货”，直播场景虽然没有那么重要，但优质的直播视觉效果也是促进观众停留的因素。绿幕的虚拟直播场景方案是一个比较低成本的直播样式。选择绿幕作为背景，通过抠图技术打造虚拟背景，可以低成本的快速打造一个直播间。手机上就有相关绿幕视频抠图App，288元就能购买永久会员，解锁所有功能。虚拟直播间的场景搭建成本也因多种因素而异，包括场景规模、复杂度、细节程度、互动特效等，更大、更复杂、更详细的直播间就需要更多的投入了。MR设备在未来的普及，也会带动新的一轮技术迭代，届时用户可以身临其境，还能与场景、主播、观众联动，更加沉浸式的互动购物体验。

虚拟主播，能在电商直播间站稳脚跟吗？

目前，虚拟数字人从技术驱动方式上可以分为两类，一种是“中之人”驱动，另一种是由AI驱动。“中之人”这个词源自日语“中の人”，字面意思是“在里面的人”，主要用于指控制虚拟主播进行直播的人。通过动作捕捉和面部捕捉技术，实现虚拟人与现实的交互。动作捕捉技术可以提供一套全身动捕硬件设备，售价约为29000元，另需缴纳800元的软件年度服务费。如果只需要捕捉面部表情，价格则约为6000元左右。总的来说，“中之人”是虚拟人物的“皮囊”，而“中之人”才是其真正的灵魂。AI驱动是通过AI技术实现虚拟人的创建、驱动和内容生成的综合技术，使其具备感知、表达等交互能力。AI驱动的虚拟人能够智能地读取并解析外部输入信息，并根据解析结果做出决策，然后驱动人物模型生成相应的语音和动作，从而与用户进行互动。这种“一站式”技术让虚拟数字人具备更加自然、智能、人性化的交互能力。