M

Magnet Small 30secs

facebookによって開発
MAGNeTはテキストから音楽や音声を生成するモデルで、テキスト記述に基づいて高品質なオーディオサンプルを生成できます。
ダウンロード数 215
リリース時間 : 1/10/2024

モデル概要

MAGNeTは32kHz EnCodecトークナイザーに基づくマスク生成非自己回帰型Transformerで、50Hzでサンプリングされた4つのコードブックを使用します。意味的トークン条件付けやモデルカスケードを必要とせず、単一の非自己回帰型Transformerで全ての4つのコードブックを生成します。

モデル特徴

単一非自己回帰型Transformer
単一の非自己回帰型Transformerで全ての4つのコードブックを生成し、モデルカスケードが不要です。
高品質オーディオ生成
テキスト記述に基づいて高品質なオーディオサンプルを生成できます。
マルチコードブック生成
50Hzでサンプリングされた4つのコードブックを使用してオーディオを生成します。

モデル能力

テキストから音楽生成
テキストから音声生成
高品質オーディオ合成

使用事例

音楽制作
特定スタイルの音楽生成
テキスト記述に基づいて80年代ヒップホップスタイルのファンクハウス音楽など、特定スタイルの音楽を生成します。
30秒の高品質音楽サンプルを生成します。
ポッドキャストBGM
ポッドキャストのオープニングに適した魅力的なリズムを生成します。
30秒の高品質なバックグラウンドミュージックを生成します。
効果音生成
特定効果音生成
テキスト記述に基づいて自然環境音や機械音など、特定の効果音を生成します。
30秒の高品質な効果音サンプルを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase