Stability AI 发布 Stable Audio 3.0 可生成超6分钟音乐

Stability AI今日推出Stable Audio 3.0系列音频模型,顶级大模型能生成超过6分钟的专业级音乐作品,保持结构与旋律连贯性,较2024年发布的2.0版本长度翻倍。该系列包含小、中、大四款模型,小模型参数459M,适合设备端生成2分钟以内音效与音乐;中大模型支持完整6分20秒编曲。

公司同时开放小SFX、小模型和中模型的权重,供开发者免费修改使用,大模型则通过API和付费自托管提供,年收入超100万美元企业需购买企业许可。所有模型基于授权数据训练,此前已与华纳音乐、环球音乐集团达成合作,聘请前Universal Audio首席数字官Ethan Kaplan负责专业音乐产品线。

这一发布正值AI音乐生成赛道白热化。Suno与Udio因训练数据版权问题陷入诉讼,ElevenLabs等玩家也在加速布局。Stability选择开源+授权双轨路线,与纯闭源玩家形成对比,试图在效率、合规与开发者生态间取得平衡。

下一步值得观察的是,Stability能否凭借专业工具与授权优势,在Google、OpenAI等大厂音乐功能落地前抢占创作者与企业市场,以及开源权重是否引发更多垂直应用落地。

信源:https://techcrunch.com/2026/05/20/stability-ai-release-a-new-audio-model-that-can-create-six-minute-songs/

📤 分享这篇文章

𝕏 X 分享in LinkedIn

点击”分享微信好友”→ 长按图片发到微信