M

Musicgen Small

facebookによって開発
MusicGenはテキスト記述またはオーディオプロンプトから高品質な音楽サンプルを生成するテキストtoミュージックモデルです。
ダウンロード数 123.91k
リリース時間 : 6/8/2023

モデル概要

単段階自己回帰型Transformerモデルで、32kHz EnCodecトークナイザーでトレーニングされ、50Hzサンプリングの4つのコードブックを備えており、自己教師付きセマンティック表現なしで音楽を生成できます。

モデル特徴

単段階生成
自己教師付きセマンティック表現が不要で、4つのコードブックを一度に生成可能
並列予測
コードブック間の微小な遅延により並列予測を実現、1秒のオーディオにわずか50の自己回帰ステップ
マルチコードブック処理
32kHz EnCodecトークナイザーを採用し、50Hzサンプリングの4つのコードブックを装備

モデル能力

テキスト記述に基づく音楽生成
様々な音楽スタイルの生成に対応
生成音楽の長さを制御可能

使用事例

音楽制作
BGM生成
ポッドキャストや動画などのコンテンツ向けにカスタマイズされたBGMを生成
音楽インスピレーション探索
異なるプロンプトを通じて音楽制作の可能性を探る
研究応用
生成モデル研究
音楽生成モデルの限界と可能性を探求
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase