M

Musicgen Melody

由facebook開發
MusicGen是一個簡單可控的音樂生成模型,能夠根據文本描述或旋律輸入生成高質量音樂。
下載量 3,632
發布時間 : 6/8/2023

模型概述

MusicGen是一個單階段自迴歸Transformer模型,基於32kHz EnCodec標記器訓練,使用4個以50Hz採樣的碼本。與現有方法不同,它不需要自監督的語義表示,並能一次性生成所有碼本。

模型特點

並行預測
通過在碼本之間引入微小延遲,實現並行預測,每秒音頻僅需50個自迴歸步驟。
旋律引導生成
可以根據給定的音頻旋律和文本描述生成音樂,保持原始旋律特徵。
簡單可控
不需要自監督的語義表示,模型結構簡單且易於控制。

模型能力

文本到音樂生成
旋律引導音樂生成
多種音樂風格生成

使用案例

音樂創作
背景音樂生成
為視頻、遊戲等內容生成定製背景音樂。
可生成8秒至更長的音樂片段
旋律擴展
基於現有旋律片段生成完整音樂作品。
保持原始旋律特徵的同時擴展音樂內容
研究
音樂生成AI研究
用於探索生成模型在音樂領域的應用。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase