M

Musicgen Stereo Melody

由facebook開發
MusicGen是一款由Meta AI開發的文本生成音樂模型,能夠根據文本描述或音頻提示生成高質量立體聲音樂樣本。
下載量 82
發布時間 : 10/23/2023

模型概述

基於Transformer的自迴歸音樂生成模型,支持通過文本描述或旋律提示生成32kHz立體聲音樂,無需自監督語義表示即可一次性生成全部音頻碼本。

模型特點

立體聲生成
通過兩路令牌流交錯處理實現立體聲輸出,相比單聲道版本有更佳的空間感
旋律控制
支持輸入參考旋律,生成的音樂將保持原有旋律輪廓
高效生成
採用延遲碼本預測技術,每秒音頻僅需50個自迴歸步驟
多碼本並行
同時預測4個EnCodec碼本,無需分階段生成

模型能力

文本到音樂生成
旋律引導音樂生成
立體聲音頻合成
音樂風格轉換

使用案例

創意輔助
背景音樂生成
根據場景描述自動生成匹配的背景音樂
可生成8-30秒不同風格的音樂片段
旋律擴展
基於用戶提供的簡單旋律發展完整編曲
保持原始旋律特徵的同時添加和聲與節奏
研究應用
生成模型研究
探索音頻生成模型的架構與控制方法
提供可比較的基線模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase