M

Musicgen Stereo Large

facebookによって開発
MusicGenはMeta AIが開発したテキストから音楽を生成するモデルで、ステレオ生成をサポートし、テキスト説明やオーディオプロンプトに基づいて高品質な音楽サンプルを生成できます。
ダウンロード数 382
リリース時間 : 10/23/2023

モデル概要

MusicGenは単段階自己回帰型Transformerアーキテクチャを採用し、32kHzサンプリングのEnCodecトークナイザーでトレーニングされており、ステレオ効果の生成をサポートし、自己教師付きセマンティック表現なしで全てのコードブックを一度に生成できます。

モデル特徴

ステレオサポート
2つのトークンストリームと遅延モードのインターリーブ処理によりステレオ効果を実現し、空間感と方向性を強化します。
効率的な生成
並列予測技術を採用し、1秒のオーディオにわずか50回の自己回帰ステップで、生成効率を大幅に向上させます。
メロディガイド
テキスト説明や既存のメロディプロンプトに基づいて音楽を生成することをサポートし、創作の制御性を強化します。
マルチスケールモデル
300M/1.5B/3.3Bの3つのパラメータ規模を提供し、異なる計算リソースのニーズに対応します。

モデル能力

テキストから音楽生成
メロディガイド付き生成
ステレオ生成
高品質音楽サンプル生成

使用事例

音楽創作
バックグラウンドミュージック生成
シーン説明に基づいてマッチするバックグラウンドミュージックを自動生成
32kHzサンプリングレートのステレオオーディオを生成
メロディ拡張
既存のメロディ断片に基づいて完全なアレンジを生成
オリジナルメロディ特徴を保持した多様なバリエーション
学術研究
生成モデル研究
オーディオ生成モデルの限界と改善方向を探求
定量化可能な客観的評価指標を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase