M

Musicgen Stereo Melody

facebookによって開発
MusicGenはMeta AIが開発したテキストから音楽を生成するモデルで、テキスト説明またはオーディオプロンプトに基づいて高品質なステレオ音楽サンプルを生成できます。
ダウンロード数 82
リリース時間 : 10/23/2023

モデル概要

Transformerベースの自己回帰型音楽生成モデルで、テキスト説明またはメロディプロンプトを使用して32kHzステレオ音楽を生成可能。自己教師付き意味表現なしで全てのオーディオコードブックを一度に生成します。

モデル特徴

ステレオ生成
2つのトークンストリームをインターリーブ処理することでステレオ出力を実現し、モノラル版よりも優れた空間感を提供
メロディ制御
参照メロディを入力可能で、生成音楽は元のメロディ輪郭を保持
効率的な生成
遅延コードブック予測技術を採用し、1秒のオーディオに50回の自己回帰ステップのみを必要
マルチコードブック並列
4つのEnCodecコードブックを同時予測し、段階的な生成が不要

モデル能力

テキストから音楽生成
メロディ誘導音楽生成
ステレオオーディオ合成
音楽スタイル変換

使用事例

クリエイティブ支援
BGM生成
シーン説明に基づいてマッチするBGMを自動生成
8-30秒の異なるスタイルの音楽フラグメントを生成可能
メロディ拡張
ユーザー提供のシンプルなメロディから完全な編曲を展開
オリジナルメロディ特徴を保持しつつ和声とリズムを追加
研究応用
生成モデル研究
オーディオ生成モデルのアーキテクチャと制御方法を探索
比較可能なベースラインモデルを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase