M

Musicgen Melody Large

由facebook開發
MusicGen是一款由Meta AI開發的文本生成音樂模型,能夠根據文本描述或音頻提示生成高質量音樂樣本。
下載量 1,414
發布時間 : 10/23/2023

模型概述

MusicGen採用單階段自迴歸Transformer架構,基於32kHz EnCodec分詞器訓練,支持通過文本或文本+旋律生成音樂。

模型特點

旋律引導生成
支持通過文本描述結合旋律提示生成音樂,增強創作控制力
高效並行預測
通過碼本延遲技術實現每秒音頻僅需50個自迴歸步驟
多碼本處理
同時處理4個以50Hz採樣的碼本,一次性生成完整音頻

模型能力

文本到音樂生成
旋律引導音樂生成
高質量音頻合成

使用案例

音樂創作
背景音樂生成
為視頻內容自動生成匹配的背景音樂
可生成8-30秒的高質量音樂片段
旋律改編
基於現有旋律生成不同風格的音樂變體
保持原旋律特徵的同時改變音樂風格
AI研究
生成模型研究
探索音頻生成模型的技術邊界
提供可比較的基準模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase