M

Musicgen Stereo Melody Large

Developed by facebook
MusicGen是一款支持立体声和旋律引导的文本到音乐生成模型,能够根据文本描述或音频提示生成高质量音乐样本。
Downloads 61
Release Time : 10/23/2023

Model Overview

MusicGen是一个基于Transformer架构的自回归音乐生成模型,支持通过文本描述或旋律引导生成32kHz立体声音频。该模型采用EnCodec音频分词器,能一次性生成所有码本,实现高效音乐合成。

Model Features

立体声支持
通过20万次迭代微调实现的立体声生成能力,采用延迟模式处理两路令牌流
旋律引导
支持根据输入旋律生成风格匹配的音乐,保持原始旋律特征
高效生成
采用并行预测机制,每秒音频仅需50个自回归步骤,显著提升生成速度
多码本联合预测
一次性生成所有4个码本,无需分阶段处理

Model Capabilities

文本到音乐生成
旋律引导音乐生成
立体声音频合成
多种音乐风格生成

Use Cases

创意内容生成
背景音乐创作
为视频、游戏等内容生成定制背景音乐
可根据文本描述快速生成匹配场景情绪的音乐
旋律扩展
基于现有旋律片段生成完整编曲
保持原始旋律特征的同时丰富音乐表现
音乐研究
音乐生成算法研究
用于探索AI音乐生成的前沿技术
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase