Wav2vec2 Vd Bird Sound Classification
MIT
基於wav2vec2-base訓練的鳥類聲音分類模型,可識別21種印度Vedanthangal鳥類保護區的鳥類物種
音頻分類
Transformers 英語

W
greenarcade
133
1
Voiceguard
MIT
基於Wav2Vec2微調的音頻分類器,能夠區分真人語音和AI生成語音。
音頻分類
Transformers 英語

V
Mrkomiljon
127
1
Wavlm Large Finetuned SER
基於WavLM-Large的語音情感識別模型,支持英文語音情感分類。
音頻分類 英語
W
JBJoyce
139
0
Whisper Tiny De Emodb Emotion Classification
Apache-2.0
基於openai/whisper-tiny微調的德語情感分類模型,在Emo-DB數據集上達到91.59%準確率
音頻分類
Transformers 德語

W
Flocksserver
27
0
Distilhubert Finetuned Cry Detector
Apache-2.0
基於distilhubert架構微調的哭聲檢測模型,在評估集上表現出色,準確率達98.83%
音頻分類
Transformers

D
Marcos12886
22
1
Deepfake Audio Detection
Apache-2.0
基於音頻文件夾數據集微調的Deepfake音頻檢測模型,能夠高效識別合成語音,評估準確率達99.64%
音頻分類
Transformers

D
MelodyMachine
107
0
Deepfake Audio Detection
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻檢測模型,在評估集上準確率達95.45%
音頻分類
Transformers

D
Heem2
246
0
Urdu Emotions Whisper Medium
Apache-2.0
基於Whisper-medium微調的烏爾都語情感識別模型,在評估集上準確率達91.67%
音頻分類
Transformers

U
Pak-Speech-Processing
43
0
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類
Transformers

W
firdho26
68
0
AST ASVspoof2019 Synthetic Voice Detection
MIT
該模型是基於MIT/ast-finetuned-audioset-10-10-0.4593微調的版本,用於檢測合成語音。
音頻分類
Transformers 英語

A
MattyB95
18
1
Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals
Apache-2.0
基於HuBERT架構微調的動物聲音分類模型,可識別10類動物叫聲,準確率達95%
音頻分類
Transformers

W
ardneebwar
555
7
Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
基於wav2vec2架構的音頻分類模型,在privateSLI數據集上微調,用於年齡和性別識別任務
音頻分類
Transformers

W
languageresearch
15
0
Ast Finetuned Speech Commands V2
Bsd-3-clause
基於Speech Commands v2數據集微調的音頻頻譜圖變換器模型,用於音頻分類任務,準確率達98.12%。
音頻分類
Transformers

A
MIT
10.94k
15
Trillsson3 Ft Keyword Spotting 14
基於TRillsson3架構的音頻分類模型,在superb數據集上微調,用於關鍵詞識別任務,準確率達91.5%。
音頻分類
Transformers

T
vumichien
47
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98