wav2vec2-base开源音频分类模型 - 免费部署精准分类音乐和语音

Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan

由 0bi0n3 开发

基于wav2vec2架构的音频分类模型，在GTZAN数据集上微调，用于音乐和语音分类任务

下载量 15

发布时间 : 9/16/2023

模型简介

该模型是基于wav2vec2架构的音频分类模型，专门针对音乐和语音分类任务进行了微调。在GTZAN数据集上取得了85%的准确率。

高准确率

在GTZAN数据集上达到85%的分类准确率

基于wav2vec2架构

利用先进的wav2vec2架构进行音频特征提取和分类

音乐/语音分类

专门针对音乐和语音分类任务进行优化

音频分类

音乐识别

语音识别

音频内容分析

音乐流媒体分类

自动识别音频流中的音乐内容

准确率85%

语音内容检测

在混合音频中识别语音内容