Stability AI 发布 Stable Audio 3.0 可生成超6分钟音乐

Stability AI今日推出Stable Audio 3.0系列音频模型，顶级大模型能生成超过6分钟的专业级音乐作品，保持结构与旋律连贯性，较2024年发布的2.0版本长度翻倍。该系列包含小、中、大四款模型，小模型参数459M，适合设备端生成2分钟以内音效与音乐；中大模型支持完整6分20秒编曲。

公司同时开放小SFX、小模型和中模型的权重，供开发者免费修改使用，大模型则通过API和付费自托管提供，年收入超100万美元企业需购买企业许可。所有模型基于授权数据训练，此前已与华纳音乐、环球音乐集团达成合作，聘请前Universal Audio首席数字官Ethan Kaplan负责专业音乐产品线。

这一发布正值AI音乐生成赛道白热化。Suno与Udio因训练数据版权问题陷入诉讼，ElevenLabs等玩家也在加速布局。Stability选择开源+授权双轨路线，与纯闭源玩家形成对比，试图在效率、合规与开发者生态间取得平衡。

下一步值得观察的是，Stability能否凭借专业工具与授权优势，在Google、OpenAI等大厂音乐功能落地前抢占创作者与企业市场，以及开源权重是否引发更多垂直应用落地。

信源：https://techcrunch.com/2026/05/20/stability-ai-release-a-new-audio-model-that-can-create-six-minute-songs/

📤 分享这篇文章

𝕏 X 分享 in LinkedIn

点击”分享微信好友”→ 长按图片发到微信