# 高精度音頻分類

Wav2vec2 Vd Bird Sound Classification
MIT
基於wav2vec2-base訓練的鳥類聲音分類模型,可識別21種印度Vedanthangal鳥類保護區的鳥類物種
音頻分類 Transformers 英語
W
greenarcade
133
1
Voiceguard
MIT
基於Wav2Vec2微調的音頻分類器,能夠區分真人語音和AI生成語音。
音頻分類 Transformers 英語
V
Mrkomiljon
127
1
Wavlm Large Finetuned SER
基於WavLM-Large的語音情感識別模型,支持英文語音情感分類。
音頻分類 英語
W
JBJoyce
139
0
Whisper Tiny De Emodb Emotion Classification
Apache-2.0
基於openai/whisper-tiny微調的德語情感分類模型,在Emo-DB數據集上達到91.59%準確率
音頻分類 Transformers 德語
W
Flocksserver
27
0
Distilhubert Finetuned Cry Detector
Apache-2.0
基於distilhubert架構微調的哭聲檢測模型,在評估集上表現出色,準確率達98.83%
音頻分類 Transformers
D
Marcos12886
22
1
Deepfake Audio Detection
Apache-2.0
基於音頻文件夾數據集微調的Deepfake音頻檢測模型,能夠高效識別合成語音,評估準確率達99.64%
音頻分類 Transformers
D
MelodyMachine
107
0
Deepfake Audio Detection
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻檢測模型,在評估集上準確率達95.45%
音頻分類 Transformers
D
Heem2
246
0
Urdu Emotions Whisper Medium
Apache-2.0
基於Whisper-medium微調的烏爾都語情感識別模型,在評估集上準確率達91.67%
音頻分類 Transformers
U
Pak-Speech-Processing
43
0
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類 Transformers
W
firdho26
68
0
AST ASVspoof2019 Synthetic Voice Detection
MIT
該模型是基於MIT/ast-finetuned-audioset-10-10-0.4593微調的版本,用於檢測合成語音。
音頻分類 Transformers 英語
A
MattyB95
18
1
Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals
Apache-2.0
基於HuBERT架構微調的動物聲音分類模型,可識別10類動物叫聲,準確率達95%
音頻分類 Transformers
W
ardneebwar
555
7
Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
基於wav2vec2架構的音頻分類模型,在privateSLI數據集上微調,用於年齡和性別識別任務
音頻分類 Transformers
W
languageresearch
15
0
Ast Finetuned Speech Commands V2
Bsd-3-clause
基於Speech Commands v2數據集微調的音頻頻譜圖變換器模型,用於音頻分類任務,準確率達98.12%。
音頻分類 Transformers
A
MIT
10.94k
15
Trillsson3 Ft Keyword Spotting 14
基於TRillsson3架構的音頻分類模型,在superb數據集上微調,用於關鍵詞識別任務,準確率達91.5%。
音頻分類 Transformers
T
vumichien
47
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase