目前在 AI 音乐生成领域,主要方式是“提示词+歌词”。具有代表性的产品有 Suno 和 Udio,Suno 在 a16z 最新统计的生成式 AI 网页端产品排名位居 Top5,半年内上升了 31 个名次,能生成 4 分钟的歌曲;Udio 排名 Top33,能生成 2 分钟的歌曲,但中文发音还有待提高。近半年二者丰富了一些可控性,如上传音频作为生成参考以及支持片段修改。
除此之外,还有类似的原生工具如海绵音乐、MusicFX,以及其它赛道的产品如剪映、TikTok、Mubert、唱鸭、网易天音等,通过集成生成能力来丰富功能提升体验。
AI 音乐生成的实际应用归纳为 5 个场景,生成技术在音乐视频和功能型音乐创作中正在发挥商业价值,社交娱乐和业余音乐创作场景未产生明确价值,专业创作领域尚待 AI 融合进工作流。
ElevenLabs 推出了自己的音乐生成模型 ElevenLabs Music,并展示了早期预览版生成的歌曲,该模型可直接通过文本提示生成完整带歌词音乐,歌曲风格涵盖流行摇滚、乡村、爵士、当代 R&B 和独立摇滚等多样化类型。详细内容,更多试听:https://xiaohu.ai/p/7687
目前AI音乐生成的主要方式是“提示词+歌词”,最具代表性的产品依然是Suno和Udio,分别在a16z最新统计的生成式AI网页端产品排名位居[Top5和Top33](https://a16z.com/100-gen-ai-apps-3/)(基于月独立访问量),其中Suno更是在半年内上升了31个名次。目前Suno可以生成4分钟的歌曲,Udio则为2分钟但中文发音还有待提高,近半年二者也丰富了一些可控性如上传音频作为生成参考以及支持片段修改。除此之外,还有些类似的原生工具如[海绵音乐](https://www.haimian.com/featured)、[MusicFX](https://aitestkitchen.withgoogle.com/zh/tools/music-fx),以及其它赛道的产品如剪映、TikTok、Mubert、唱鸭、网易天音等,通过集成生成能力来丰富功能提升体验。我将AI音乐生成的实际应用归纳为5个场景,生成技术在音乐视频和功能型音乐创作中正在发挥商业价值,社交娱乐和业余音乐创作场景未产生明确价值,专业创作领域尚待AI融合进工作流。
[heading2]前言[content]在近两年的生成式人工智能浪潮中,图片和视频领域已经取得了许多进展,音乐领域则大约是今年3月才开始崭露头角。在这半年间,也产生了许多技术和产品迭代以及应用案例。结合我的个人实践、产品体验和用户调研,我总结了AI音乐生成在哪些应用场景中发挥了价值?有哪些代表产品?哪些需求暂未满足?我会按照AI音乐生成、AI歌声生成/转换、AI音效生成这三个方向来阐述对应的用户场景和AI产品,希望对大家了解AI音乐目前进展及未来趋势有所帮助。本文为上篇,AI音乐生成。
[495_1715311793.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/XvYmbU6rTofFyOxRlJpcCh2unUe?allow_redirect=1)ElevenLabs推出其自己的音乐生成模型ElevenLabs Music并展示了早期预览版生成的歌曲,该模型可直接通过文本提示生成完整带歌词音乐。ElevenLabs声称这些歌曲都是根据单个文本提示生成的,没有任何编辑。各首歌曲风格涵盖流行摇滚、乡村、爵士、当代R&B和独立摇滚等多样化类型。详细内容,更多试听:https://xiaohu.ai/p/7687