M

Musicgen Melody Large

facebookによって開発
MusicGenはMeta AIが開発したテキストから音楽を生成するモデルで、テキスト説明やオーディオプロンプトに基づいて高品質な音楽サンプルを生成できます。
ダウンロード数 1,414
リリース時間 : 10/23/2023

モデル概要

MusicGenはシングルステージ自己回帰型Transformerアーキテクチャを採用し、32kHz EnCodecトークナイザーでトレーニングされており、テキストまたはテキスト+メロディによる音楽生成をサポートします。

モデル特徴

メロディ誘導生成
テキスト説明とメロディプロンプトを組み合わせた音楽生成をサポートし、創作制御力を強化
効率的な並列予測
コードブック遅延技術により、1秒のオーディオにわずか50の自己回帰ステップで生成
マルチコードブック処理
50Hzでサンプリングされた4つのコードブックを同時処理し、完全なオーディオを一度に生成

モデル能力

テキストから音楽生成
メロディ誘導音楽生成
高品質オーディオ合成

使用事例

音楽創作
BGM生成
ビデオコンテンツに合わせたBGMを自動生成
8-30秒の高品質音楽クリップを生成可能
メロディアレンジ
既存のメロディに基づいて異なるスタイルの音楽バリエーションを生成
元のメロディ特徴を保持しつつ音楽スタイルを変更
AI研究
生成モデル研究
オーディオ生成モデルの技術的限界を探求
比較可能なベンチマークモデルを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase