M

Magnet Medium 10secs

facebookによって開発
MAGNeTはテキストから音楽や音声を生成するモデルで、テキスト記述に基づいて高品質なオーディオサンプルを生成できます。
ダウンロード数 322
リリース時間 : 1/10/2024

モデル概要

MAGNeTは32kHz EnCodecトークナイザーに基づくマスク生成非自己回帰Transformerで、50Hzでサンプリングされた4つのコードブックを使用します。セマンティックトークン条件やモデルカスケードを必要とせず、単一の非自己回帰Transformerで全ての4つのコードブックを生成します。

モデル特徴

非自己回帰生成
単一の非自己回帰Transformerを使用して全てのコードブックを生成し、モデルカスケードを必要としません。
高品質オーディオ生成
テキスト記述に基づいて高品質なオーディオサンプルを生成できます。
マルチコードブック処理
50Hzでサンプリングされた4つのコードブックを使用してオーディオを生成します。

モデル能力

テキストから音楽生成
テキストから音声生成

使用事例

音楽制作
特定スタイルの音楽生成
テキスト記述に基づいて80年代ヒップホップスタイルのファンクハウス音楽など、特定スタイルの音楽を生成します。
10秒間の高品質音楽サンプルを生成します。
リラックスした楽曲生成
テキスト記述に基づいてローファイ、チルエレクトロニック、スローテンポの影響を受けたリラックスした楽曲を生成します。
10秒間の高品質音楽サンプルを生成します。
ポッドキャスト制作
ポッドキャストオープニング音楽生成
テキスト記述に基づいてポッドキャストのオープニングに適した魅力的なビートを生成します。
10秒間の高品質音楽サンプルを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase