M

Magnet Small 10secs

Developed by facebook
MAGNeT是一个文本到音乐和文本到声音的模型,能够根据文本描述生成高质量的音频样本。
Downloads 976
Release Time : 1/10/2024

Model Overview

MAGNeT是一个基于32kHz EnCodec分词器的掩码生成非自回归Transformer,使用4个以50 Hz采样的码本进行训练。它不需要语义标记条件或模型级联,使用单一的非自回归Transformer生成所有4个码本。

Model Features

非自回归生成
使用单一的非自回归Transformer生成所有码本,无需级联模型
高质量音频生成
能够根据文本描述生成32kHz采样率的高质量音频样本
多样化风格支持
支持生成多种音乐风格,包括嘻哈、放克浩室、低保真等

Model Capabilities

文本到音乐生成
文本到音效生成
短音频片段生成(10秒)

Use Cases

音乐创作
背景音乐生成
为视频、播客等内容生成背景音乐
生成10秒长的音乐片段
音乐灵感探索
通过文本提示探索不同风格的音乐创作可能性
生成多样化的音乐样本
音效设计
游戏音效生成
为游戏场景生成环境音效
生成10秒长的音效片段
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase