M

Musicgen Large

facebookによって開発
MusicGenはテキストから音楽を生成するモデルで、テキストの説明やオーディオのヒントに基づいて高品質な音楽サンプルを生成できます。
ダウンロード数 5,125
リリース時間 : 6/8/2023

モデル概要

MusicGenは単一ステージの自己回帰型Transformerアーキテクチャを採用し、32kHzのEnCodecトークナイザーでトレーニングされ、4つの50Hzサンプリングのコードブックを使用しています。自己教師ありの意味表現を必要とせず、4つのコードブックを一度に生成できます。

モデル特徴

効率的な生成
コードブックの並列予測により、1秒のオーディオに必要な自己回帰ステップはわずか50回で、生成効率が大幅に向上します
高品質な出力
32kHzのEnCodecトークナイザーでトレーニングされており、生成される音楽サンプルの品質が高いです
柔軟な制御
テキスト説明とオーディオヒントの2つの入力方法をサポートし、より柔軟な音楽生成制御を提供します

モデル能力

テキストから音楽生成
音楽スタイル変換
メロディ誘導生成

使用事例

音楽制作
BGM生成
動画やゲームなどのコンテンツ向けにカスタマイズされたBGMを生成
特定のスタイルやムードに合った音楽を生成可能
音楽インスピレーション
音楽制作者に創作のインスピレーションや素材を提供
様々なスタイルの音楽フラグメントを迅速に生成
研究応用
生成モデル研究
音楽生成モデルの限界と可能性を探求
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase