# wav2vec2微調

Deepfake Audio Detection V1
Apache-2.0
基於wav2vec2-base微調的深度偽造音頻檢測模型,準確率達99.66%
音頻分類 Transformers
D
Zeyadd-Mostaffa
33
0
Wav2vec2 Base 100k Gtzan Music Genres Finetuned Wav2vec2 Ivan
基於wav2vec2架構的音樂流派分類模型,在GTZAN數據集上微調,準確率達98%
音頻分類 Transformers
W
itmanov
32
1
Wav2vec2 Large Xlsr 53 Serbian Smart Home Commands
MIT
基於wav2vec2的塞爾維亞語智能家居語音指令識別模型,可識別7種控制指令
音頻分類 其他
W
mradovic38
320
0
Wav2 Noise
Apache-2.0
基於facebook/wav2vec2-base微調的噪聲識別模型,準確率達93.89%
音頻分類 Transformers
W
zylin12
1
0
My Awesome Mind Model
Apache-2.0
基於facebook/wav2vec2-base在minds14數據集上微調的音頻分類模型
音頻分類 Transformers
M
faaany
1
0
Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c
基於airesearch/wav2vec2-large-xlsr-53-th微調的泰語語音情感識別模型,支持憤怒、快樂、平靜三種情感分類
音頻分類 Transformers
W
Paranchai
9
0
Wav2vec2 Turkish Gender Classification
Apache-2.0
基於facebook/wav2vec2-base微調的土耳其語性別分類模型,在common_voice_17_0數據集上訓練,測試集準確率達84.79%
音頻分類 Transformers
W
candenizkocak
19
1
W2v Speech Emotion Recognition
MIT
基於Wav2Vec2架構微調的英語語音情感識別模型,可識別六種情感狀態
音頻分類 英語
W
Khoa
147
0
Wav2vec2 ASV Deepfake Audio Detection
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻檢測模型,用於識別合成或篡改的語音內容
說話人處理 Transformers
W
Bisher
106
1
Japanese Wav2vec2 Base Rs35kh
Apache-2.0
基於大規模日語自動語音識別語料庫ReazonSpeech v2.0微調的wav2vec 2.0 Base模型,適用於日語自動語音識別任務。
語音識別 Transformers 日語
J
reazon-research
3,968
1
Audio Emotion Detection
Apache-2.0
本模型是基於facebook/wav2vec2-large-xlsr-53微調而成的音頻情感檢測模型,可識別7種情感狀態
音頻分類 Transformers
A
Hatman
630
8
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice_16_1數據集上微調的阿姆哈拉語語音識別模型
語音識別 Transformers
W
DipsankarSinha
18
2
Wav2vec2 Base ASVSpoof5 TUC N
Apache-2.0
基於wav2vec2-base微調的語音防偽檢測模型,在評估集上達到88.89%準確率
音頻分類 Transformers
W
DavidCombei
20
0
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基於facebook/wav2vec2-large-lv60在TIMIT數據集上微調的英語音素識別模型,音素錯誤率10.53%
語音識別 Transformers 英語
W
excalibur12
103
1
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基於facebook/wav2vec2-large-lv60微調的英語音素識別模型,在TIMIT數據集上取得10.53%的音素錯誤率
語音識別 Transformers 英語
W
excalibur12
306
3
Speechbrain Emotion Recognition Openvino
Apache-2.0
該模型使用微調的wav2vec2(基礎)架構,在IEMOCAP數據集上訓練,用於語音情感識別任務。
音頻分類 英語
S
psakamoori
13
0
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在zeroth_korean數據集上微調的韓語自動語音識別模型,詞錯誤率為0.2433。
語音識別 Transformers
W
student-47
285
1
Deepfake Audio Detection
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻檢測模型,在評估集上準確率達95.45%
音頻分類 Transformers
D
Heem2
246
0
Wav2vec Base Crema Sentiment Analysis
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感分析模型,在評估集上達到70.87%的準確率
音頻分類 Transformers
W
Piyush2512
38
0
Violence Detect 44
Apache-2.0
基於facebook/wav2vec2-base-960h微調的音頻分類模型,用於檢測暴力聲音
音頻分類 Transformers
V
Hemg
28
0
Deeepfake Audio Recognition Ttoo
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻識別模型,在評估集上準確率達95.45%
音頻分類 Transformers
D
Hemg
20
0
Wav2vec2 Base Arabic Speech Emotion Recognition
Apache-2.0
基於facebook/wav2vec2-base微調的阿拉伯語語音情感識別模型,在評估集上取得了99.92%的準確率。
音頻分類 Transformers
W
ahmmedasaad2772
352
0
Wav2vec2 Base Gender Classification
Apache-2.0
基於facebook/wav2vec2-base微調的語音性別分類模型,在評估集上準確率達98.92%
音頻分類 Transformers
W
7wolf
14
1
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類 Transformers
W
firdho26
68
0
My Awesome Mind Model
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,在評估集上達到58.92%的準確率
音頻分類 Transformers
M
Krithika-p
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
基於facebook/wav2vec2-base微調的音頻情感分類模型,在評估集上準確率達73.98%
音頻分類 Transformers
W
chin-may
77
5
Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan
Apache-2.0
基於wav2vec2架構的音頻分類模型,在GTZAN數據集上微調,用於音樂和語音分類任務
音頻分類 Transformers
W
0bi0n3
15
1
Wav2vec2 Large Robust 24 Ft Age Gender
該模型以原始音頻信號作為輸入,輸出年齡預測值以及性別概率(兒童/女性/男性),同時輸出最後一層transformer的池化狀態。
音頻分類 Transformers
W
audeering
44.13k
33
Wav2vec Fine Tuned Speech Command2
Apache-2.0
基於facebook/wav2vec2-base在speech_commands數據集上微調的語音識別模型,準確率達97.35%
音頻分類 Transformers
W
Thamer
16
0
Viet Tones Model
基於wav2vec2-base-vietnamese-250h微調的越南語聲調識別模型,準確率59.72%
語音識別 Transformers
V
StevenLe456
22
0
Asr Wav2vec2 Commonvoice 14 Zh CN
Apache-2.0
這是一個基於CommonVoice中文數據集訓練的端到端自動語音識別系統,使用wav2vec2.0和CTC架構,支持中文語音識別。
語音識別 中文
A
speechbrain
36
9
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
這是一個基於CommonVoice西班牙語數據集訓練的端到端自動語音識別系統,使用wav2vec 2.0預訓練模型結合CTC解碼器。
語音識別 西班牙語
A
speechbrain
22
3
Wav2vec2 Base Finetuned Gtzan
Apache-2.0
該模型是基於facebook/wav2vec2-base在GTZAN數據集上微調的音頻分類模型,主要用於音樂流派分類任務。
音頻分類 Transformers
W
wilson-wei
14
0
Wav2vec2 Base Down On
Apache-2.0
基於facebook/wav2vec2-base微調的二進制音頻分類模型,專門用於區分'down'和'on'的發音
音頻分類 Transformers
W
MatsRooth
20
0
Wav2vec2 Base Music Speech Both Classification
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,用於區分音樂和語音
音頻分類 Transformers
W
FerhatDk
20
0
Wav2vec2 Nepali
基於Facebook的wav2vec2模型微調的尼泊爾語語音識別模型
語音識別 Transformers 其他
W
anish-shilpakar
312
1
Neunit Nihaochangchu V3
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,在superb數據集上訓練,準確率達99.99%
音頻分類 Transformers
N
SHENMU007
14
0
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上表現出色
語音識別 Transformers
B
Juardo
19
0
SER Wav2vec2 Large Xlsr 53 Eng Zho Adults
基於wav2vec2-large-xlsr-53微調的跨語言跨年齡組語音情感識別模型,支持英語和中文
音頻分類 Transformers 支持多種語言
S
CAiRE
32
0
Wav2musicgenre
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,用於識別音樂流派
音頻分類 Transformers
W
ramonpzg
20
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase