W

Wav2vec2 Base Music Speech Both Classification

由 FerhatDk 开发
基于facebook/wav2vec2-base微调的音频分类模型,用于区分音乐和语音
下载量 20
发布时间 : 7/10/2023

模型简介

该模型是基于wav2vec2-base架构微调的音频分类器,专门用于区分音乐和语音两类音频内容。在评估集上达到了98.47%的准确率。

模型特点

高准确率
在评估集上达到98.47%的分类准确率
基于wav2vec2架构
利用wav2vec2-base预训练模型进行微调,具有良好的音频特征提取能力
轻量级训练
仅需8个训练轮次即可达到高性能

模型能力

音频分类
音乐识别
语音识别

使用案例

音频内容分析
音乐/语音自动分类
自动识别音频内容是音乐还是语音
准确率98.47%
媒体管理
音频库自动分类
为音频库中的内容自动添加音乐/语音标签
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase