M

Musicgen Stereo Medium

由facebook開發
Meta AI發佈的立體聲音樂生成模型,支持通過文本描述生成高質量音樂
下載量 303
發布時間 : 10/23/2023

模型概述

基於文本描述或音頻提示生成立體聲音樂樣本的文本轉音樂模型,採用自迴歸Transformer架構

模型特點

立體聲生成
通過雙聲道令牌流和延遲交錯處理實現立體聲音效
單階段生成
無需自監督語義表徵,可一次性生成全部4個碼本
並行預測
通過碼本間微小延遲設計實現每秒50個自迴歸步驟的並行預測
旋律引導
支持基於現有旋律進行音樂生成(需使用特定變體)

模型能力

文本描述生成音樂
音頻提示引導生成
立體聲音頻生成
多風格音樂生成

使用案例

音樂創作
背景音樂生成
為視頻/播客生成定製背景音樂
可生成符合場景情緒的音樂片段
音樂靈感探索
通過不同風格組合發現新音樂創意
生成融合多種風格元素的實驗性音樂
音頻製作
音效設計
生成特定場景的音效或過渡音樂
可生成符合要求的短音頻片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase