whisper-base-finetuned-gtzan开源语音分类模型 - 免费部署精准识别音乐流派

Whisper Base Finetuned Gtzan

由 vineetsharma 开发

基于OpenAI的whisper-base模型在GTZAN数据集上微调的语音分类模型，主要用于音乐流派分类任务。

下载量 15

发布时间 : 7/3/2023

模型简介

该模型是基于whisper-base架构的变体，专门针对音乐流派分类任务进行了优化。在GTZAN数据集上取得了87%的准确率。

高准确率

在GTZAN测试集上达到87%的分类准确率

微调优化

基于whisper-base模型针对音乐分类任务专门优化

轻量级

基于whisper-base架构，相对轻量（推断）

音乐流派分类

音频特征提取

音乐分析

音乐流派自动分类

对音乐片段进行流派分类

准确率87%

音乐推荐系统

作为音乐推荐系统的预处理组件