I

Inspiremusic 1.5B 24kHz

由FunAudioLLM開發
InspireMusic是一個專注於音樂生成、歌曲生成和音頻生成的統一框架,通過音頻標記化技術整合自迴歸變換器與基於流匹配模型,支持高質量長音頻生成。
下載量 62
發布時間 : 1/17/2025

模型概述

InspireMusic是一個通過音頻標記化技術整合自迴歸變換器與基於流匹配模型的統一音樂、歌曲及音頻生成框架。該工具包提供了基於AI生成高質量音樂的訓練與推理代碼,支持通過文本和音頻提示可控地生成音樂、歌曲和音頻。

模型特點

統一框架
整合音頻標記器、自迴歸變換器和超分辨率流匹配模型,支持多種音頻生成任務
高質量音樂生成
能夠生成高音質的音樂,支持24kHz單聲道和48kHz立體聲輸出
長篇幅生成能力
特別優化的1.5B參數模型支持長達數分鐘的音樂生成
多模態輸入
支持通過文本和音頻提示進行可控生成

模型能力

文本到音樂生成
音樂續寫
音樂重建
音樂超分辨率處理

使用案例

音樂創作
背景音樂生成
為餐廳、水療中心等場所生成符合氛圍的背景音樂
生成帶有特定風格(如波薩諾瓦、爵士等)的高質量音樂
音樂續寫
基於現有音樂片段進行延續創作
保持原音樂風格和質量的連貫續寫
音頻處理
音樂超分辨率
提升低質量音頻的分辨率和音質
生成更高採樣率、更豐富聲學細節的音頻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase