M

Musicgen Stereo Small

由facebook開發
基於文本描述生成高質量立體聲音樂樣本的AI模型,支持300M參數規模
下載量 7,091
發布時間 : 10/23/2023

模型概述

MusicGen是一款通過文本提示或音頻參考生成音樂的文本轉音樂模型,採用立體聲技術增強空間感

模型特點

立體聲生成
通過雙聲道音頻系統營造具有方位感和層次感的聽覺體驗
高效並行預測
採用延遲交錯模式處理碼本,每秒音頻僅需50步自迴歸運算
多規模選擇
提供300M/1.5B/3.3B三種參數規模及文本/旋律兩種變體

模型能力

根據文本描述生成音樂
支持風格混合(如嘻哈+放克)
生成32kHz採樣率的立體聲音頻
支持最長256個新token的生成

使用案例

音樂創作
背景音樂生成
為視頻/播客快速生成定製化配樂
生成符合場景氛圍的立體聲音樂
音樂靈感激發
通過風格混合提示探索新音樂類型
生成融合多種風格的實驗性音樂片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase