R

Riffusion Model V1

由riffusion開發
Riffusion是一款基於穩定擴散技術的即時音樂生成應用,可根據文本輸入生成頻譜圖並轉換為音頻片段。
下載量 2,354
發布時間 : 12/13/2022

模型概述

Riffusion是一種潛在文本-圖像擴散模型,通過微調Stable-Diffusion-v1-5檢查點實現音樂頻譜圖生成,可轉換為音頻片段。

模型特點

即時音樂生成
能夠根據文本提示即時生成音樂頻譜圖並轉換為音頻片段
基於穩定擴散技術
採用經過微調的Stable-Diffusion-v1-5模型架構,具備強大的生成能力
開放許可
採用CreativeML OpenRAIL-M許可證,允許商用和研究用途

模型能力

文本到頻譜圖生成
頻譜圖到音頻轉換
即時音樂創作
創意音頻生成

使用案例

藝術創作
音樂作品生成
根據文本描述自動生成原創音樂片段
生成可播放的音頻文件
教育工具
音樂概念教學
通過可視化頻譜圖輔助音樂理論教學
直觀展示音頻與頻譜的關係
研究開發
生成模型研究
探索跨模態(文本-音頻)生成技術
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase