# XLSR微調

Wav2vec2 Large Chinese Zh Cn
Apache-2.0
基於XLSR-53大模型微調的中文語音識別模型,支持16kHz採樣率的語音輸入
語音識別 Transformers 中文
W
wbbbbb
585
40
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V4
Apache-2.0
該模型是基於gary109/ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v3在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型。
語音識別 Transformers
A
gary109
189
0
Wav2vec2 Large Ru Golos
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的俄語語音識別模型,使用Sberdevices Golos數據集訓練,支持16kHz音頻輸入
語音識別 Transformers 其他
W
bond005
1,182
12
Xlrs Best Lm
Apache-2.0
這是一個基於XLSR Wav2Vec2架構的印尼語自動語音識別模型,在公共語音印尼語數據集上進行了微調。
語音識別 Transformers 其他
X
ridhoalattqas
19
1
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型在common_voice土耳其語數據集上微調的語音識別模型
語音識別 Transformers
W
masoumehb
21
0
Wav2vec2 Large Xlsr Es Col Pro Noise
Apache-2.0
基於jonatasgrosman/wav2vec2-large-xlsr-53-spanish微調的西班牙語語音識別模型,針對哥倫比亞口音和噪聲環境優化
語音識別 Transformers
W
Santiagot1105
18
0
Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice數據集進行微調的語音識別模型
語音識別 Transformers 中文
W
ydshieh
127
32
Wav2vec2 Large Xlsr Es Col Pro
Apache-2.0
基於jonatasgrosman/wav2vec2-large-xlsr-53-spanish微調的西班牙語(哥倫比亞)語音識別模型
語音識別 Transformers
W
Santiagot1105
20
0
Wav2vec2 Large Xlsr Es Col Test
Apache-2.0
這是一個基於jonatasgrosman/wav2vec2-large-xlsr-53-spanish模型在特定數據集上微調的語音識別模型,支持西班牙語。
語音識別 Transformers
W
Santiagot1105
30
1
Wav2vec2 Large Xlsr Galician
針對加利西亞語優化的自動語音識別模型,基於wav2vec2-large-xlsr-53微調,WER指標7.12
語音識別 Transformers
W
ifrz
9,330
1
Wav2vec2hindiasr
Apache-2.0
基於Wav2Vec2架構的印地語自動語音識別(ASR)模型,在公共語音數據集上微調
語音識別 Transformers
W
SAGAR4REAL
31
1
Speech Text
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在英語通用語音數據集上微調的自動語音識別模型,支持16kHz採樣率的英語語音輸入。
語音識別 英語
S
abidlabs
25
0
Wav2vec2 Large Xlsr Persian V3
基於Facebook的wav2vec2-large-xlsr-53模型在波斯語通用語音庫上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
W
m3hrdadfi
1,888
37
Wav2vec2 Large Xlsr Hindi Colab
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的印地語語音識別模型
語音識別 Transformers
W
nvshubhsharma
17
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在西班牙語Common Voice數據集上微調的自動語音識別(ASR)模型。
語音識別 西班牙語
W
mrm8488
38
2
Wav2vec2 Large Xlsr Kyrgyz
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在吉爾吉斯語通用語音數據集上微調的自動語音識別模型。
語音識別 其他
W
iarfmoose
22
2
Fonxlsr
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的豐語(Fon)語音識別模型,測試WER為14.97%
語音識別 其他
F
chrisjay
56
7
Xlsr 53 Wav2vec Hi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的印地語語音識別模型,在低資源印度語言的多語言和語碼轉換ASR挑戰賽數據上訓練
語音識別 Transformers 其他
X
harshit345
38
0
Wav2vec2 Swedish Common Voice
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在瑞典語Common Voice數據集上微調的語音識別模型,訓練數據量為402MB。
語音識別 其他
W
birgermoell
24
1
Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese
Apache-2.0
這是一個基於MT5架構的越南語自動語音識別(ASR)修復模型,針對越南語語音識別任務進行了微調。
語音識別 其他
F
leduytan93
25
0
Wav2vec2 Large Xlsr Polish
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在Common Voice波蘭語數據集上微調的語音識別模型,測試集詞錯誤率23.01%
語音識別 其他
W
mbien
40
1
Wav2vec2 Large Xlsr Cantonese
Apache-2.0
基於Facebook的wav2vec2-large-xlsr-53模型微調的粵語語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 其他
W
ctl
1,010
12
Wav2vec2 Large Xlsr Kazakh
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53微調的哈薩克語自動語音識別(ASR)模型,在哈薩克語音語料庫v1.1上訓練,測試WER為19.65%。
語音識別 其他
W
aismlv
12.08k
17
Wav2vec2 Large Xlsr Javanese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的爪哇語自動語音識別模型,訓練數據來自OpenSLR高質量爪哇語TTS數據。
語音識別 其他
W
cahya
659
0
Wav2vec2 Large Xlsr 53 Tatar
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在韃靼語上微調的自動語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 其他
W
crang
163
1
Wav2vec2 Large Xlsr 53 Th
這是一個基於wav2vec2-large-xlsr-53模型在泰語通用語音7.0數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
airesearch
110.74k
21
Wav2vec2 Large Xlsr Frisian
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在弗里斯蘭語上進行微調的自動語音識別模型,使用通用語音數據集訓練。
語音識別
W
iarfmoose
170
0
Wav2vec2 Large Xlsr Punjabi
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在旁遮普語語音數據上微調的自動語音識別(ASR)模型。
語音識別
W
manandey
20.46k
1
Wav2vec2 Large Xlsr Persian V2
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在波斯語(波斯語)上使用Common Voice數據集進行微調的自動語音識別模型
語音識別 其他
W
m3hrdadfi
47
6
Wav2vec2 Large Xlsr Tamil
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在泰米爾語上使用Common Voice數據集進行微調的自動語音識別模型。
語音識別 其他
W
manandey
50
0
Wav2vec2 Large Xlsr Nahuatl
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的納瓦特爾語(ncj方言)語音識別模型
語音識別 Transformers
W
tyoc213
18
1
Wav2vec2 Large Xlsr 53 Irish
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用Common Voice數據集對愛爾蘭語進行了微調的語音識別模型。
語音識別
W
cpierse
22
0
Wav2vec2 Large Xlsr Arabic
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在阿拉伯語Common Voice數據集上微調的自動語音識別模型
語音識別 阿拉伯語
W
kmfoda
19
1
Wav2vec2 Large Xlsr Coraa Portuguese Cv8
Apache-2.0
基於Edresson/wav2vec2-large-xlsr-coraa-portuguese在common_voice數據集上微調的葡萄牙語語音識別模型
語音識別 Transformers
W
lgris
34
0
Wav2vec2 Large Xlsr Marathi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的馬拉地語自動語音識別模型,在OpenSLR馬拉地語數據集上訓練,測試集詞錯誤率12.7%。
語音識別 Transformers 其他
W
sumedh
5,159
2
Wav2vec2 Xlsr Nepali
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的尼泊爾語自動語音識別模型,在OpenSLR和Common Voice數據集上訓練,測試WER為5.97%。
語音識別 其他
W
gagan3012
1,950
6
Wav2vec2 Large Xlsr Czech
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在捷克語Common Voice數據集上微調的語音識別模型,測試WER為24.56%。
語音識別 其他
W
arampacha
2,570
2
Wav2vec2 Large Xlsr Cnh
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的哈卡欽語語音識別模型,在通用語音數據集上訓練,測試WER為31.38%。
語音識別 其他
W
gchhablani
22
0
Wav2vec2 Large Xlsr 53 Ia
Apache-2.0
基於Facebook的wav2vec2-large-xlsr-53模型微調而成的國際語語音識別模型,在Common Voice國際語數據集上達到22.08%的詞錯誤率。
語音識別 其他
W
anuragshas
28
0
Wav2vec2 Large Xlsr Estonian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在愛沙尼亞語Common Voice數據集上微調的自動語音識別模型
語音識別 其他
W
manandey
21
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase