Chat with Wiki - AI模拟真人配音

Answer

以下是关于 AI 模拟真人配音的相关信息：

在游戏领域，声音和配乐是重要部分，已有公司用生成式人工智能生成音频。音效方面，虽有学术论文探讨相关想法，但能直接应用于游戏的商业产品还少。游戏互动性使其成为生成式人工智能的应用方向，可通过游戏参数实时模拟更真实音效，解决传统游戏中预先录制脚步声的繁琐和不真实问题。配乐对游戏很重要，但不变的音乐易令玩家厌烦，且难精确配合随机场景和动作。
2024 年内，AI 音频能力有长足进展，带感情的 AI 配音基本成熟。
Flawless 公司利用 AI 创建与原版电影一样沉浸和真实的唇形同步配音版本。
Suno 宣布即将推出从任何声音创作歌曲的新功能。

Content generated by AI large model, please carefully verify (powered by aily)

References

声音和配乐是游戏体验的重要部分。已经有公司开始使用生成式人工智能生成音频，以补充图形方面的工作。音效声音效果是人工智能的另一个有吸引力的领域。已经有学术论文探讨了使用人工智能在电影中生成"foley"的想法（例如脚步声），不过目前能够直接在游戏中应用的商业产品还很少。笔者认为，这只是一个时间问题，因为游戏的互动性使其成为生成式人工智能的一个明显的应用，既可以创造静态的声音效果作为生产的一部分（"游戏里的激光枪音效等等"），也可以在运行时创造实时的互动声音效果。想象一下，如何给玩家角色生成脚步声（笔者注：例如CS和吃鸡里的脚步声..）？大多数传统游戏，会通过少量预先录制的脚步声来解决这个问题：例如，在草地上行走、在砾石上行走、在草地上跑步、在砾石上跑步等等。这些声音的发布和管理都很繁琐，而且运行的时候听起来重复且不真实。更好的方法是实时通过生成式AI的模拟音效，产生合适且更真实的的音效，通过游戏中的参数，如地面、角色、的重量、步态、鞋类等不同的介质，表现出不同的音效。音乐（游戏配乐）配乐对游戏来说很重要，因为它可以帮助故事主题设定感情基调，就像在电影或电视中一样。但由于游戏持续的时间更长，有的时候能持续数百甚至数千小时，不变的音乐可能很快变得重复或令玩家厌烦。此外，由于游戏具备互动性质，游戏配乐很难完全精确地配合屏幕上随机发生的场景和动作。

AGI 万字长文（下）| 2024，分叉与洪流

2024年内图片-超短视频的精细操控：表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频：风格化、动漫风最先成熟；真人稍晚AI音频能力长足进展：带感情的AI配音基本成熟“全真AI颜值网红”出现，可以稳定输出视频，可以直播带货游戏AI NPC有里程碑式进展，出现新的游戏生产方式AI男/女朋友聊天基本成熟：记忆上有明显突破，可以较好模拟人的感情，产品加入视频音频，粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展，办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例：数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷，虽然大多数不会成功中国AI达到或超过GPT4水平；美国出现GPT5；世界上开始现“主权AI”华为昇腾生态开始形成，国内推理芯片开始国产替代（训练替代要稍晚）AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野，并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟：正常人无法区别AI生成还是实景拍摄全真AI虚拟人成熟：包含感情的AI NPC成熟，开放世界游戏成熟；游戏中几乎无法区别真人和NPCAR/VR技术大规模商用接近AGI的技术出现人与AI配合的工作方式成为常态，很多日常决策开始由AI来执行AI生产的数据量超过全人类生产数据量，“真实”成为稀缺资源具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破“人的模型”出现，出现“集中化AGI”与“个人AGI”的历史分叉AI引发的社会问题开始加重，结构性失业开始出现AGI对于地缘政治的影响开始显露……"Limit of Understanding";Yifei Gong 2024,with Dall-E

XiaoHu.AI日报

?Xiaohu.AI日报「5月26日」✨✨✨✨✨✨✨✨1️⃣Flawless：利用AI创建与原版电影一样沉浸和真实的唇形同步配音版本，Flawless是一家生成式人工智能电影制作技术的公司。-他们的TrueSync工具能够创建与原版电影一样沉浸和真实的配音版本，确保配音在任何语言中的唇同步都完美无瑕。可以为电影和电视节目创建多语言版本，确保每个版本的对话都与演员的口型完美匹配，就像是在用他们的母语一样。?https://x.com/imxiaohu/status/17947089587474927532️⃣Suno宣布即将推出一项全新的功能可以从从任何声音创作歌曲。-这项新功能可以将日常生活中的各种声音转化为音乐，为音乐创作带来了新的可能性。你只需要敲击出节奏，Suno会自动捕捉然后与你“和弦”，哈哈...首个示例是：将敲击浇水壶的声音转化为迷幻摇滚音乐。?https://x.com/imxiaohu/status/17947136420611937113️⃣Responder无人机对接911报警系统可70秒抵达案发现场实时监控-具有情境感知系统，可以实时传送案发现场画面并提供实时监控和急救设备运送。?https://x.com/imxiaohu/status/17947281842458216124️⃣马斯克的xAI公司计划建造一台巨大的超级计算机，称为“超级计算工厂”。-这台超级计算机将使用10万个H100 GPU来训练和运行其AI模型Grok的下一个版本。