M

Magnet Small 10secs

facebookによって開発
MAGNeTはテキストから音楽や音声を生成するモデルで、テキストの説明に基づいて高品質なオーディオサンプルを生成できます。
ダウンロード数 976
リリース時間 : 1/10/2024

モデル概要

MAGNeTは32kHz EnCodecトークナイザーに基づくマスク生成非自己回帰型Transformerで、50Hzでサンプリングされた4つのコードブックを使用してトレーニングされています。セマンティックトークンの条件付けやモデルのカスケードは不要で、単一の非自己回帰型Transformerですべての4つのコードブックを生成します。

モデル特徴

非自己回帰生成
単一の非自己回帰型Transformerですべてのコードブックを生成し、カスケードモデルが不要
高品質オーディオ生成
テキストの説明に基づいて32kHzサンプリングレートの高品質オーディオサンプルを生成可能
多様なスタイル対応
ヒップホップ、ファンクハウス、ローファイなど様々な音楽スタイルの生成をサポート

モデル能力

テキストから音楽生成
テキストから効果音生成
短いオーディオクリップ生成(10秒)

使用事例

音楽制作
BGM生成
動画やポッドキャストなどのコンテンツ向けにBGMを生成
10秒の音楽クリップを生成
音楽インスピレーション探索
テキストプロンプトを通じて様々なスタイルの音楽制作の可能性を探る
多様な音楽サンプルを生成
効果音デザイン
ゲーム効果音生成
ゲームシーン向けに環境音を生成
10秒の効果音クリップを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase