M

Musicgen Small

由facebook開發
MusicGen是一款基於文本描述或音頻提示生成高質量音樂樣本的文本到音樂模型。
下載量 123.91k
發布時間 : 6/8/2023

模型概述

單階段自迴歸Transformer模型,採用32kHz EnCodec分詞器訓練,配備4個50Hz採樣的碼本,無需自監督語義表徵即可生成音樂。

模型特點

單階段生成
無需自監督語義表徵,可一次性生成全部4個碼本
並行預測
通過碼本間微小延遲實現並行預測,每秒鐘音頻僅需50個自迴歸步驟
多碼本處理
採用32kHz EnCodec分詞器,配備4個50Hz採樣的碼本

模型能力

根據文本描述生成音樂
支持多種音樂風格生成
可控制生成音樂時長

使用案例

音樂創作
背景音樂生成
為播客、視頻等內容生成定製背景音樂
音樂靈感探索
通過不同提示詞探索音樂創作可能性
研究應用
生成模型研究
探索音樂生成模型的侷限性和可能性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase