M

Mert Base

Developed by yangwang825
MERT是一种基于自监督学习的声学音乐理解模型,通过教师模型提供伪标签进行预训练。
Downloads 26
Release Time : 8/6/2023

Model Overview

MERT模型专注于音频分类任务,特别适用于音乐理解领域。它通过引入教师模型在掩码语言建模(MLM)风格的声学预训练中提供伪标签,从而提升模型性能。

Model Features

自监督预训练
采用大规模自监督训练方法,无需大量标注数据即可学习有效特征
教师模型指导
在预训练过程中引入教师模型提供伪标签,提升训练效果
多采样率支持
能够处理不同采样率的音频输入(16kHz-44.1kHz)

Model Capabilities

音频特征提取
音乐分类
声学信号处理

Use Cases

音乐分析
音乐流派分类
对音乐片段进行流派自动分类
音乐情感识别
识别音乐表达的情感类型
音频处理
音频特征提取
提取音频的高级特征表示
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase