ast-finetuned-audioset开源音频分类模型 - 精准识别音乐流派，准确率达92%

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 Bhanu9Prakash 开发

这是一个基于AST(Audio Spectrogram Transformer)架构的音频分类模型，在GTZAN音乐流派分类数据集上微调，准确率达到92%。

下载量 50

发布时间 : 7/11/2023

模型简介

该模型专门用于音乐流派分类任务，能够识别10种不同的音乐类型。基于AST架构，在AudioSet数据集预训练后，又在GTZAN数据集上进行了微调。

高准确率

在GTZAN测试集上达到92%的分类准确率

基于Transformer架构

采用AST(Audio Spectrogram Transformer)架构处理音频频谱

两阶段训练

先在AudioSet大规模数据集预训练，再在GTZAN数据集微调

音乐流派分类

音频特征提取

音频内容分析

音乐服务

音乐自动分类

为音乐流媒体平台自动分类上传的音乐文件

准确识别10种音乐流派

音乐分析

音乐推荐系统

基于音乐内容的特征提取和分类

提高推荐系统的内容理解能力

属性	详情
基础模型	MIT/ast-finetuned-audioset-10-10-0.4593
标签	generated_from_trainer
数据集	marsyas/gtzan
指标	准确率
模型名称	ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan
任务类型	音频分类
数据集名称	GTZAN
数据集类型	marsyas/gtzan
数据集配置	all
数据集划分	train
数据集参数	all
评估指标	准确率
准确率值	0.92