W

Wav2vec2 Base Finetuned Gtzan

由 wilson-wei 开发
该模型是基于facebook/wav2vec2-base在GTZAN数据集上微调的音频分类模型,主要用于音乐流派分类任务。
下载量 14
发布时间 : 7/29/2023

模型简介

基于wav2vec2架构的音频分类模型,在GTZAN数据集上微调,能够识别10种不同的音乐流派。

模型特点

高准确率
在GTZAN测试集上达到84%的准确率
基于wav2vec2架构
利用自监督学习预训练的语音表示模型
轻量级
基于wav2vec2-base版本,相对较小

模型能力

音乐流派分类
音频特征提取

使用案例

音乐分析
音乐流派自动分类
对音乐片段进行自动流派分类
84%准确率
音乐推荐系统
作为音乐推荐系统的特征提取组件
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase