Chat with Wiki - deepfake的技术原理是什么？

Answer

深度伪造技术（deepfakes）是一种利用 AI 程序和深度学习算法实现音视频模拟和伪造的技术。其原理在于投入深度学习的内容库越大，合成的视音频真实性越高，甚至可以达到以假乱真的程度。例如，粉丝们会通过 Stems 音轨分离工具将人声与原始歌曲分离，再使用人声转换模型将人声转换成另一位明星的风格，然后将新的人声轨道与原始作品重新拼接在一起。Diff-SVC 就是一种特别流行的用于此目的的语音传输模型。

目前，深度赝品的创建需要大量的计算技能，但现在几乎任何人都可以创建它们。生成式人工智能系统迅速导致了许多法律和道德问题，比如由人工智能创建的图像和视频声称是真实的，但实际上并非如此，已经出现在媒体、娱乐和政治领域。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI 语音合成

所谓深度伪造技术（deepfakes），是一种利用AI程序和深度学习算法实现音视频模拟和伪造的技术，投入深度学习的内容库越大，合成的视音频真实性越高，甚至可以达到以假乱真的程度。[heading2]AI翻唱[content]粉丝们会通过Stems音轨分离工具将人声与原始歌曲分离，再使用人声转换模型将人声转换成另一位明星的风格，然后将新的人声轨道与原始作品重新拼接在一起。Diff-SVC就是一种特别流行的用于此目的的语音传输模型。

生成式人工智能如何改变创意工作

我们已经看到这些生成式人工智能系统迅速导致了许多法律和道德问题。“Deepfakes”，即由人工智能创建的图像和视频，声称是真实的，但实际上并非如此，已经出现在媒体、娱乐和政治领域。然而迄今为止，深度赝品的创建需要大量的计算技能。然而现在，几乎任何人都可以创建它们。OpenAI尝试通过为每个DALL-E 2图像添加独特符号的“水印”来控制假图像。然而，未来可能需要更多的控制——特别是当[生成视频创作](https://www.theverge.com/2022/9/29/23378210/meta-text-to-video-ai-generation-make-a-video-model-dall-e)成为主流时。生成式人工智能还提出了许多关于什么是原创和专有内容的问题。由于创建的文本和图像与以前的任何内容都不完全相同，因此这些系统的提供商认为它们属于其提示创建者。但它们显然是之前用于训练模型的文本和图像的衍生品。不用说，这些技术将在未来几年为知识产权律师提供大量工作。从这几个商业应用程序的例子中可以清楚地看出，我们现在只是触及了生成式人工智能为组织及其内部人员所做的事情的表面。例如，此类系统可能很快就会成为标准做法，用于制作我们大部分或全部书面或基于图像的内容——提供电子邮件、信件、文章、计算机程序、报告、博客文章、演示文稿、视频、等等。毫无疑问，这种能力的发展将对内容所有权和知识产权保护产生巨大且不可预见的影响，但它们也有可能彻底改变知识和创造性工作。假设这些人工智能模型在它们存在的短时间内继续进步，我们很难想象它们可能带来的所有机会和影响。

Han：基于现有能力项目应用的思考

|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间||-|-|-|-|-|-|-|-|-|-|-|-|-|-||DiffusionLight：Google发明了一种估算照片中光照条件的新方法|视频商品植入更加便捷。|视频,图片|该技术可以在照片中加入一个看起来像是真实反射环境的铬球。这个铬球可以帮助计算出照片中的光照是怎样的。 然后，他们使用这些光照信息在照片中添加新的物体，使得这些物体看起来好像是在原来的光照条件下拍摄的一样。 简单地说就是：检测图片中的光源（光照信息），然后根据光源，把其他物体对象插入到图片中，能达到相同的光影效果，毫无违和感。|这项技术的一个关键创新是它不需要昂贵或复杂的设备来捕获光照条件。它只需要一张图片和强大的算法。这意味着它可以用于从专业电影制作到手机摄影的各种应用，为艺术家和开发者创造新的可能性。 该技术可以用于多种输入图像，如室内外场景、特写镜头、绘画和人脸照片。|工作原理如下： 1、输入图片：你提供一张照片，比如一个室内场景。 2、添加铬球：使用DiffusionLight技术，在照片中的合适位置绘制一个铬球。这个