M

Musicgen Stereo Melody Large

facebookによって開発
MusicGenは、テキスト記述またはオーディオプロンプトに基づいて高品質な音楽サンプルを生成できる、ステレオとメロディガイドをサポートするテキストから音楽への生成モデルです。
ダウンロード数 61
リリース時間 : 10/23/2023

モデル概要

MusicGenは、Transformerアーキテクチャに基づく自己回帰型音楽生成モデルで、テキスト記述またはメロディガイドによる32kHzステレオオーディオの生成をサポートしています。このモデルはEnCodecオーディオトークナイザーを採用し、すべてのコードブックを一度に生成することで効率的な音楽合成を実現します。

モデル特徴

ステレオサポート
20万回のイテレーションによる微調整で実現したステレオ生成能力で、遅延モードを使用して2つのトークンストリームを処理します
メロディガイド
入力メロディに基づいてスタイルが一致する音楽を生成し、元のメロディ特性を保持します
効率的な生成
並列予測メカニズムを採用し、1秒のオーディオにわずか50の自己回帰ステップで、生成速度を大幅に向上させます
マルチコードブック共同予測
4つのコードブックを一度に生成し、段階的な処理を不要にします

モデル能力

テキストから音楽生成
メロディガイド音楽生成
ステレオオーディオ合成
様々な音楽スタイルの生成

使用事例

クリエイティブコンテンツ生成
バックグラウンドミュージック作成
動画、ゲームなどのコンテンツ向けにカスタマイズされたバックグラウンドミュージックを生成
テキスト記述に基づいてシーンの雰囲気に合った音楽を迅速に生成可能
メロディ拡張
既存のメロディ断片に基づいて完全なアレンジを生成
元のメロディ特性を保持しながら音楽表現を豊かにする
音楽研究
音楽生成アルゴリズム研究
AI音楽生成の最先端技術を探求するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase