W

Wav2vec2 Base Music Speech Both Classification

由FerhatDk開發
基於facebook/wav2vec2-base微調的音頻分類模型,用於區分音樂和語音
下載量 20
發布時間 : 7/10/2023

模型概述

該模型是基於wav2vec2-base架構微調的音頻分類器,專門用於區分音樂和語音兩類音頻內容。在評估集上達到了98.47%的準確率。

模型特點

高準確率
在評估集上達到98.47%的分類準確率
基於wav2vec2架構
利用wav2vec2-base預訓練模型進行微調,具有良好的音頻特徵提取能力
輕量級訓練
僅需8個訓練輪次即可達到高性能

模型能力

音頻分類
音樂識別
語音識別

使用案例

音頻內容分析
音樂/語音自動分類
自動識別音頻內容是音樂還是語音
準確率98.47%
媒體管理
音頻庫自動分類
為音頻庫中的內容自動添加音樂/語音標籤
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase