W

Wav2vec2 Base Drum Kit Sounds

由DunnBC22開發
基於facebook/wav2vec2-base微調的多類別音頻分類模型,用於識別鼓類樂器聲音
下載量 15
發布時間 : 1/23/2023

模型概述

該模型能夠識別音頻樣本中敲擊的鼓類樂器類型,包括底鼓(kick)、懸鑔(overheads)、軍鼓(snare)和通鼓(toms)。

模型特點

高精度分類
在評估集上達到78.12%的準確率,能夠有效區分不同鼓類樂器聲音
基於wav2vec2架構
利用強大的wav2vec2-base模型進行微調,繼承了其優秀的音頻特徵提取能力
多指標評估
提供包括準確率、F1值、召回率和精確率在內的全面評估指標

模型能力

音頻分類
鼓類樂器識別
音頻特徵提取

使用案例

音樂製作
自動鼓類樂器分類
在音樂製作過程中自動識別和分類錄音中的鼓類樂器
準確率達到78.12%
音樂教育
鼓類樂器學習輔助
幫助學習者識別和區分不同鼓類樂器的聲音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase