# XLSR-53微調

Wav2vec2 Large Xlsr Deepfake Audio Classification
Apache-2.0
基於wav2vec2架構的音頻分類模型,針對深度偽造音頻檢測任務進行微調,在性別識別和偽造音頻檢測方面表現優異。
音頻分類 Transformers
W
Gustking
345
3
Wav2vec2 Large Xlsr 53 Amharic
MIT
該模型是在facebook/wav2vec2-large-xlsr-53基礎上,使用阿姆哈拉語語音語料庫進行微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
agkphysics
2,539
4
Exp W2v2t It Xlsr 53 S387
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
18
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的日語自動語音識別模型,使用Common Voice 7.0日語數據集訓練
語音識別 Transformers 日語
E
jonatasgrosman
20
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7
Apache-2.0
基於wav2vec2-large-xlsr-53的自動語音識別模型,專為StepMania遊戲音頻優化,在GARY109/AI_LIGHT_DANCE數據集上微調
語音識別 Transformers
A
gary109
162
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 2
基於wav2vec2-large-xlsr-53模型微調的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上訓練
語音識別 Transformers
A
gary109
68
1
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3
基於wav2vec2-large-xlsr-53模型微調的自動語音識別模型,專注於歌唱語音識別
語音識別 Transformers
A
gary109
97
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V6
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型。
語音識別 Transformers
A
gary109
160
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1
該模型是基於wav2vec2-large-xlsr-53架構的自動語音識別(ASR)模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2數據集上微調得到,主要用於歌唱語音識別任務。
語音識別 Transformers
A
gary109
66
1
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上微調
語音識別 Transformers
A
gary109
191
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2數據集上微調的自動語音識別模型,主要用於歌唱語音識別任務。
語音識別 Transformers
A
gary109
185
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V2
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE數據集上微調的自動語音識別模型
語音識別 Transformers
A
gary109
166
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調得到的自動語音識別模型。
語音識別 Transformers
A
gary109
48
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在AI Light Dance數據集上微調的自動語音識別模型。
語音識別 Transformers
A
gary109
26
1
Ai Light Dance Chord Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_Light_Dance - ONSET-CHORD2數據集上微調的自動語音識別模型。
語音識別 Transformers
A
gary109
46
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型
語音識別 Transformers
A
gary109
40
0
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53 5gram V1
該模型是基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING數據集上微調得到,主要用於歌唱語音識別。
語音識別 Transformers
A
gary109
18
1
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在AI_LIGHT_DANCE - ONSET-SINGING數據集上微調的自動語音識別模型,主要用於歌唱語音識別任務。
語音識別 Transformers
A
gary109
23
1
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別 Transformers
W
cutten
16
0
Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice土耳其語數據集上微調的語音識別模型
語音識別 Transformers
W
bekirbakar
17
0
Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h
MIT
基於842小時未標註和14小時標註盧森堡語語音數據微調的wav2vec2.0大模型,支持盧森堡語語音識別
語音識別 Transformers 其他
W
Lemswasabi
204
0
Wav2vec2 Common Voice Tr Demo Dist
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型,在評估集上取得了0.3242的詞錯誤率。
語音識別 Transformers 其他
W
cromz22
26
0
FYP ARABIZI
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在未知數據集上微調得到的語音識別模型,支持阿拉伯語方言(Arabizi)的識別。
語音識別 Transformers
F
ali-issa
33
1
Bach Arb
基於jonatasgrosman/wav2vec2-large-xlsr-53-german微調的德語語音識別模型
語音識別 Transformers
B
bkh6722
30
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT數據集上微調的版本,用於立陶宛語語音識別。
語音識別 Transformers 其他
W
birgermoell
17
0
Ft Pt Br Local
Apache-2.0
基於jonatasgrosman/wav2vec2-large-xlsr-53-portuguese微調的葡萄牙語自動語音識別模型
語音識別 Transformers
F
tonyalves
31
1
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的中文語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 中文
W
jonatasgrosman
3.8M
110
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的荷蘭語語音識別模型,在Common Voice和CSS10數據集上訓練,支持16kHz音頻輸入。
語音識別 其他
W
jonatasgrosman
3.0M
12
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在荷蘭語Common Voice數據集上微調的自動語音識別模型,測試WER為17.09%。
語音識別 Transformers 其他
W
wietsedv
44
1
Wav2vec2 Large Xlsr 53 W2V2 TATAR SMALL
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在Common Voice 8數據集上微調的韃靼語(Tatar)自動語音識別模型,測試集WER為53.16%。
語音識別 Transformers 其他
W
emre
30
1
Wav2vec2 Large Xlsr 53 Sakha
Apache-2.0
基於XLSR-53大模型微調的雅庫特語語音識別模型,詞錯誤率32.23%
語音識別 其他
W
anton-l
25
0
Wav2vec2 Large Xlsr 53 Finnish
Apache-2.0
基於XLSR-53大模型微調的芬蘭語語音識別模型,支持16kHz音頻輸入
語音識別 其他
W
jonatasgrosman
73.11k
1
Wav2vec2 Large Xlsr 53 German
Apache-2.0
這是一個針對德語語音識別任務微調的XLSR-53大模型,基於Facebook的wav2vec2-large-xlsr-53模型,在Common Voice 6.1德語數據集上進行了微調。
語音識別 德語
W
jonatasgrosman
8,266
7
Wav2vec2 Common Voice Tr Demo
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE SV-SE數據集上微調的自動語音識別(ASR)模型,支持瑞典語語音識別。
語音識別 Transformers
W
birgermoell
17
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
shiyue
25
0
Wav2vec2 Large Xlsr 53 French
Apache-2.0
這是一個基於XLSR-53大模型微調的法語語音識別模型,在Common Voice數據集上訓練,支持高準確率的法語語音轉文本。
語音識別 法語
W
jonatasgrosman
47.83k
11
Wav2vec2 Large Xlsr 53 Euskera
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型在巴斯克語(Euskera)上使用Common Voice數據集進行微調的語音識別模型。
語音識別 其他
W
mrm8488
28
0
Wav2vec2 Large Xlsr Gu
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的古吉拉特語自動語音識別模型,在OpenSLR數據集上達到23.55%的WER
語音識別 其他
W
gchhablani
3,582
0
Wav2vec2 Large Xlsr Kn
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在卡納達語上進行微調的自動語音識別(ASR)模型,使用OpenSLR SLR79數據集訓練。
語音識別 其他
W
amoghsgopadi
2,200
1
Wav2vec2 Xlsr 53 Rm Vallader With Lm
Apache-2.0
基於wav2vec2-xlsr-53的羅曼什語瓦拉迪爾方言語音識別模型,帶有語言模型支持
語音識別 Transformers
W
anuragshas
16
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase