M

Musicgen Melody

facebookによって開発
MusicGenはシンプルで制御可能な音楽生成モデルで、テキスト説明やメロディ入力に基づいて高品質な音楽を生成できます。
ダウンロード数 3,632
リリース時間 : 6/8/2023

モデル概要

MusicGenはシングルステージ自己回帰Transformerモデルで、32kHz EnCodecトークナイザーでトレーニングされ、50Hzでサンプリングされた4つのコードブックを使用します。既存の方法とは異なり、自己教師ありの意味表現を必要とせず、すべてのコードブックを一度に生成できます。

モデル特徴

並列予測
コードブック間に微小な遅延を導入することで並列予測を実現し、1秒のオーディオにわずか50の自己回帰ステップで済みます。
メロディ誘導生成
与えられたオーディオメロディとテキスト説明に基づいて音楽を生成し、元のメロディ特性を保持します。
シンプルで制御可能
自己教師ありの意味表現を必要とせず、モデル構造がシンプルで制御しやすいです。

モデル能力

テキストから音楽生成
メロディ誘導音楽生成
多様な音楽スタイル生成

使用事例

音楽創作
BGM生成
動画やゲームなどのコンテンツ向けにカスタマイズされたBGMを生成します。
8秒以上の音楽クリップを生成可能
メロディ拡張
既存のメロディ断片に基づいて完全な音楽作品を生成します。
元のメロディ特性を保持しながら音楽内容を拡張
研究
音楽生成AI研究
生成モデルの音楽分野への応用を探求するために使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase