Chat with Wiki - 文生音频

Answer

以下是关于文生音频的相关内容：

工具教程：清影提供了多种文生视频的示例，如冰山恶龙、蘑菇变小熊、末日宇航员、粉红小怪物、猎豹小憩等，每个示例都有详细的描述和对应的视频链接。
AI 音效工具：包括作者为 KEEN 的相关内容，如 Audiobox 是 Meta 的新音频生成基础研究模型，可结合语音输入和自然语言文本提示生成语音和声音效果；还有 Stable Audio 以及图像生成配乐模型（MAGNet，AudioLDM，audiogen）等相关链接和介绍。
乐理篇：声音和音乐的基础提到音乐创作有主观性和规律性，目前龙头的文生音乐软件如 Suno、Uido 等在简单场景有使用价值，但在音乐创作上存在提示词控制有限、创作丰富度不够等问题。同时提到 Colab 上有增强音质的脚本，但不如现有的音频处理工具，调参较难。

Content generated by AI large model, please carefully verify (powered by aily)

References

|文生视频|视频（纯享版）|视频（配音版）|PROMPT||-|-|-|-||1、冰山恶龙|[1.冰山恶龙.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/LX16bSbsKomgb3x5D9LcTqJDnKb?allow_redirect=1)|[1.冰山恶龙（音乐版）.mov](https://bytedance.feishu.cn/space/api/box/stream/download/all/Pcd0b0tWVoU126xVgRIcSrWwnOy?allow_redirect=1)|低角度向上推进，缓缓抬头，冰山上突然出现一条恶龙，然后恶龙发现你，冲向你。好莱坞电影风||2、蘑菇变小熊|[badd49fb-bbdc-593d-b6b2-d0af0b18d9c9_0.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/EMszbwWZuoCKTOx8SWGcsToLnTg?allow_redirect=1)|[2.蘑菇变小熊（音乐版）.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/R29obTvQeo9FPYxj2hccN19ynYb?allow_redirect=1)|蘑菇变成小熊||3、末日宇航员|[3.末日宇航员.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/AHdgbSinNoiwbxxpebjcpn90nve?allow_redirect=1)|[3.末日宇航员（音乐版）.mov](https://bytedance.feishu.cn/space/api/box/stream/download/all/QuytbPMYjoyZPbxW8e9cE0L9nxd?allow_redirect=1)|末日来临，穿着宇航服的航天员缓缓朝着飞船走去，眼神中透露着对地球的不舍，注意细节刻画，废土风||4、粉红小怪物|[4.粉红小怪物.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/FwxqbljhSoF1OWxBCnScyF47n6g?allow_redirect=1)|[4.粉红小怪物（音乐版）.mov](https://bytedance.feishu.cn/space/api/box/stream/download/all/C3bqbfSHfoVQUDxedsncQOYJnMc?allow_redirect=1)|动画场景，展示一个粉色的毛绒绒的小怪物抱着一块很大的芝士在吃，3d风格，需要注重画面的细节，小怪物的神情充满喜悦，表现出顽皮天真的样子。温暖的颜色和氛围的灯光。||5、猎豹小憩|[5.猎豹小憩.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/FaEWbu0JkoSEcUxEUI0cjk92nWd?allow_redirect=1)|[5.猎豹小憩（音乐版）.mov](https://bytedance.feishu.cn/space/api/box/stream/download/all/EE09beBgGoaXI5xvjf4ccy7Cnok?allow_redirect=1)|写实描绘，近距离，猎豹卧在地上睡觉，身体微微起伏|

AI音效工具

作者：KEEN原文：[AI配乐工具](https://i0x94xzpjmh.feishu.cn/docx/S5iydQBXhoMt3rxZ2qqc8MP6nsh)[heading2]Audiobox[content]https://audiobox.metademolab.com/Audiobox是Meta的新音频生成基础研究模型。它可以结合使用语音输入和自然语言文本提示来生成语音和声音效果，从而可以轻松地为各种用例创建自定义音频。[heading2]Stable Audio[content]https://www.stableaudio.com/使用下面的GPTs生成对应的提示词https://chat.openai.com/g/g-jAr0hpLsL-stableaudiogpt[heading2]图像生成配乐模型（MAGNet，AudioLDM，audiogen）[content]https://huggingface.co/spaces/fffiloni/Image2SFX-comparison[heading2]audiogen[content]文生音乐，文生拟音，在discord上使用，但效果不稳定https://discord.gg/wUuF5Uh2pR

乐理篇：声音和音乐的基础

作者：吵爷[heading1]前言[content]音乐创作相对来说是一个比较主观、感性的过程，具有非常多的不确定性。但同时音乐也具备非常强的规律性，因此有时非常复杂的音乐，听起来并不杂乱，而是给人非常直观的韵律感。后来和一些专业做音乐的朋友聊过一阵，目前龙头的文生音乐软件Suno，Uido等，对于比较简单的广告BGM，游戏配乐等使用场景，已经有非常大的使用价值，但在音乐创作上还差的很远。首先是提示词的控制：Suno除了歌词部分外，音乐风格提示词只有120个字符，能够描述和理解的关键词也非常有限，其次就是Suno的创作丰富度还是很有限，写出来的旋律相对很单调，乍一听可能还可以，但很难一直想听下去。然而行业在肉眼可见的速度增长，未来也许我们能够更加可控的进行音乐创作。在技术还没有准备好之前，如果大家喜欢这一块，可以花一些时间来稍微补充乐理相关的一些知识，配合前面的音乐流派风格prompt食用，对自己生成的音乐有更好的理解。Colab上写了一个增强音质的脚本，Suno输出的音乐可以丢进去，输出44.1khz采样率和320kpbs码率的文件，不如现有的音频处理工具。。。调参实在太难了https://colab.research.google.com/drive/1y0kyNoVNDbs1VNKR6kxAr2wsV-QWVu0-#scrollTo=AFAmnxAkkWk9