A

Audio Magnet Small

由facebook開發
MAGNeT 是一款文本到音樂和文本到聲音的模型,能夠根據文本描述生成高質量的音頻樣本。它是一個基於掩碼生成非自迴歸Transformer的模型,使用32kHz EnCodec分詞器。
下載量 161
發布時間 : 1/10/2024

模型概述

MAGNeT是一個基於非自迴歸Transformer的音頻生成模型,能夠根據文本描述生成音樂和音效。它不需要語義標記條件或模型級聯,通過單個Transformer生成所有碼本。

模型特點

非自迴歸生成
通過單個非自迴歸Transformer同時生成所有碼本,無需級聯模型
高質量音頻生成
能夠生成32kHz採樣率的高質量音樂和音效樣本
簡化流程
不需要語義標記條件,簡化了生成流程
多樣化應用
支持音樂和音效兩種生成任務,具有廣泛的應用場景

模型能力

文本到音樂生成
文本到音效生成
高質量音頻合成
多風格音樂創作

使用案例

音樂創作
音樂生成
根據文本描述生成各種風格的音樂片段
可生成歡快的搖滾、充滿活力的電子舞曲等風格音樂
音效設計
音效生成
根據文本描述生成各種環境音效和特殊效果音
可生成自然環境音、機械音效等
研究應用
生成模型研究
用於探索音頻生成模型的侷限性和可能性
推動音頻生成領域的科學進步
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase