数字人在一定程度上可以用于直播,但不能完全替代真人直播。
数字人的优势包括:
然而,数字人直播也面临一些问题:
在电商直播间中,虚拟主播面临的挑战有:
未来,随着技术的发展,或许再过十余载,虚拟主播肉身化,具备了真实的身体,可能真的能在直播间站稳脚跟。同时,MR 设备的普及也可能带动新的一轮技术迭代,为直播带来更加沉浸式的互动购物体验。
嘉宾:张晟(来自一线数字人公司)、汗青(B站搜索AI Talk)视频源地址:[AI数字人(虚拟人)讨论总结](https://bytedance.feishu.cn/docx/ZYladJDfrocZOGxylnucJeMXn0b)[heading2]AI数字人类型和应用场景?[content]1.二维/三维虚拟人:用于游戏、IP品牌(柳夜熙)、内容创作([http://AI.talk](https://t.co/EM7nnuMohc))等。2.真人形象数字人:用于直播卖货,营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等等。[heading2]AI数字人的价值是什么?[content]1.代替人说话,提升表达效率和营销效率。比如真人做不到24小时直播,但数字人可以。2.创造真实世界无法完成的对话或交流。例如AI talk的实验探索,复活故去的亲人等。[heading2]AI数字人面临的问题?[content]平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。比如抖音出台一些标准,而微信视频号容忍度更低,人工检查封号。技术限制:形象只是皮囊,智能水平和未来想象空间,依赖大模型技术提升。需求限制:直播带货算个落地场景,但不刚。“懂得都懂”的刚需场景,国内搞不了。目前更多是体验新鲜感。伦理/法律限制:声音、影像版权等,比如换脸、数字永生等等。
直播间的特点在于真实性,其中包括真实的商品展示、试用以及真实的评测,然而这也是虚拟主播面临的致命挑战。比如虚拟网红翎Ling的美妆带货翻车案例,没有皮肤问题困扰的虚拟人很难让消费者共情。尽管SLAM等3D交互技术可以完善数字人与真实空间的交互,但要想实现与商品的互动,则较为困难,更何况用户还希望能够尽可能多的了解到商品的细节。在《2022虚拟数字人综合评估指数报告》中指出虚拟数字人发展的三个阶段:拟人化:由计算机虚拟合成的高度逼真的三维动画人物,动作形态声音等与真人吻合,初步基于AI实现虚拟人驱动,实时进行信息沟通和反馈。同人化:从外观的形态模拟进阶到情感的可交互,情感算法技术实现与人类高质量情感互动。超人化:虚拟人的能力超越自然人,“虚拟”实体化,机器人承载虚拟人意识回到现实世界。或许再过十余载,虚拟主播肉身化,具备了真实的身体,他就真的能在直播间站稳脚跟了。[heading3]场景变幻,无限可能[content]相比于“人”与“货”,直播场景虽然没有那么重要,但优质的直播视觉效果也是促进观众停留的因素。绿幕的虚拟直播场景方案是一个比较低成本的直播样式。选择绿幕作为背景,通过抠图技术打造虚拟背景,可以低成本的快速打造一个直播间。手机上就有相关绿幕视频抠图App,288元就能购买永久会员,解锁所有功能。虚拟直播间的场景搭建成本也因多种因素而异,包括场景规模、复杂度、细节程度、互动特效等,更大、更复杂、更详细的直播间就需要更多的投入了。MR设备在未来的普及,也会带动新的一轮技术迭代,届时用户可以身临其境,还能与场景、主播、观众联动,更加沉浸式的互动购物体验。
目前,虚拟数字人从技术驱动方式上可以分为两类,一种是“中之人”驱动,另一种是由AI驱动。“中之人”这个词源自日语“中の人”,字面意思是“在里面的人”,主要用于指控制虚拟主播进行直播的人。通过动作捕捉和面部捕捉技术,实现虚拟人与现实的交互。动作捕捉技术可以提供一套全身动捕硬件设备,售价约为29000元,另需缴纳800元的软件年度服务费。如果只需要捕捉面部表情,价格则约为6000元左右。总的来说,“中之人”是虚拟人物的“皮囊”,而“中之人”才是其真正的灵魂。AI驱动是通过AI技术实现虚拟人的创建、驱动和内容生成的综合技术,使其具备感知、表达等交互能力。AI驱动的虚拟人能够智能地读取并解析外部输入信息,并根据解析结果做出决策,然后驱动人物模型生成相应的语音和动作,从而与用户进行互动。这种“一站式”技术让虚拟数字人具备更加自然、智能、人性化的交互能力。