W

Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan

由 0bi0n3 开发
基于wav2vec2架构的音频分类模型,在GTZAN数据集上微调,用于音乐和语音分类任务
下载量 15
发布时间 : 9/16/2023

模型简介

该模型是基于wav2vec2架构的音频分类模型,专门针对音乐和语音分类任务进行了微调。在GTZAN数据集上取得了85%的准确率。

模型特点

高准确率
在GTZAN数据集上达到85%的分类准确率
基于wav2vec2架构
利用先进的wav2vec2架构进行音频特征提取和分类
音乐/语音分类
专门针对音乐和语音分类任务进行优化

模型能力

音频分类
音乐识别
语音识别

使用案例

音频内容分析
音乐流媒体分类
自动识别音频流中的音乐内容
准确率85%
语音内容检测
在混合音频中识别语音内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase