M

Musicgen Stereo Medium

facebookによって開発
Meta AIがリリースしたステレオ音楽生成モデルで、テキスト記述による高品質な音楽生成をサポート
ダウンロード数 303
リリース時間 : 10/23/2023

モデル概要

テキスト記述またはオーディオプロンプトに基づいてステレオ音楽サンプルを生成するテキストから音楽へのモデルで、自己回帰型Transformerアーキテクチャを採用

モデル特徴

ステレオ生成
2チャンネルトークンストリームと遅延インターリーブ処理によるステレオサウンド効果の実現
シングルステージ生成
自己教師付きセマンティック表現が不要で、4つのコードブックを一度に生成可能
並列予測
コードブック間の微小遅延設計により、毎秒50の自己回帰ステップを並列予測
メロディガイダンス
既存のメロディに基づく音楽生成をサポート(特定のバリアント使用時)

モデル能力

テキスト記述からの音楽生成
オーディオプロンプトによる誘導生成
ステレオオーディオ生成
マルチスタイル音楽生成

使用事例

音楽制作
BGM生成
動画/ポッドキャスト向けのカスタムBGM生成
シーンの雰囲気に合った音楽クリップを生成可能
音楽インスピレーション探索
異なるスタイルの組み合わせによる新しい音楽アイデアの発見
複数スタイル要素を融合した実験的な音楽を生成
オーディオ制作
サウンドデザイン
特定シーン向けの効果音やトランジション音楽生成
要件に合った短いオーディオクリップを生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase