M

Musicgen Large

由facebook開發
MusicGen是一款文本到音樂的生成模型,能夠根據文本描述或音頻提示生成高質量的音樂樣本。
下載量 5,125
發布時間 : 6/8/2023

模型概述

MusicGen採用單階段自迴歸Transformer架構,基於32kHz的EnCodec分詞器訓練,使用4個50Hz採樣的碼本。無需自監督語義表示,可一次性生成全部4個碼本。

模型特點

高效生成
通過並行預測碼本,每秒音頻僅需50個自迴歸步驟,顯著提升生成效率
高質量輸出
基於32kHz的EnCodec分詞器訓練,生成音樂樣本質量高
靈活控制
支持文本描述和音頻提示兩種輸入方式,提供更靈活的音樂生成控制

模型能力

文本到音樂生成
音樂風格轉換
旋律引導生成

使用案例

音樂創作
背景音樂生成
為視頻、遊戲等內容生成定製背景音樂
可生成符合特定風格和情緒的音樂
音樂靈感激發
為音樂人提供創作靈感和素材
快速生成多種風格的音樂片段
研究應用
生成模型研究
探索音樂生成模型的侷限性和可能性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase