# 16kHz採樣率適配

Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
基於facebook/wav2vec2-large-robust模型微調的瑞典語自動語音識別模型,支持16kHz採樣率語音輸入。
語音識別 Transformers
E
jonatasgrosman
32
0
Exp W2v2t It Vp Fr S821
Apache-2.0
基於facebook/wav2vec2-large-fr-voxpopuli模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練
語音識別 Transformers 其他
E
jonatasgrosman
27
0
Exp W2v2t It Wavlm S895
Apache-2.0
基於microsoft/wavlm-large模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
42
0
Wav2vec2 Large Robust Ft Libri 960h
Apache-2.0
該模型是Facebook Wav2Vec2的微調版本,專注於語音識別任務,在多種語音數據上預訓練並在Librispeech上微調,具有魯棒性強的特點。
語音識別 Transformers 英語
W
facebook
161.65k
15
Wav2vec2 Large Xlsr Estonian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在愛沙尼亞語Common Voice數據集上微調的自動語音識別模型
語音識別 其他
W
manandey
21
0
Wav2vec2 Large Xlsr 53 Euskera
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型在巴斯克語(Euskera)上使用Common Voice數據集進行微調的語音識別模型。
語音識別 其他
W
mrm8488
28
0
Wav2vec2 Large Xls Ar
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的阿拉伯語自動語音識別模型,在Common Voice阿拉伯語數據集上測試WER為52%。
語音識別 Transformers 阿拉伯語
W
mohamed1ai
30
1
Wav2vec2 Large Xlsr Tamil
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的泰米爾語自動語音識別(ASR)模型
語音識別 其他
W
Thanish
86
0
Wav2vec2 Large Xlsr Arabic
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在阿拉伯語通用語音數據集上微調的語音識別模型
語音識別 Transformers 阿拉伯語
W
othrif
302
0
Wav2vec2 Large Xlsr Arabic
Apache-2.0
針對阿拉伯語語音識別微調的Wav2Vec2-Large-XLSR-53大模型,基於Common Voice和Arabic Speech Corpus數據集訓練
語音識別 阿拉伯語
W
mohammed
51
3
Wav2vec2 Large Xlsr 53 Levantine Arabic
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,在阿拉伯語音語料庫數據集上微調的阿拉伯語語音識別模型
語音識別 阿拉伯語
W
elgeish
46
4
Wav2vec2 Large Xlsr 53 Ukrainian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在烏克蘭語上使用Common Voice數據集進行微調的自動語音識別模型
語音識別 其他
W
mrm8488
25
1
Vakyansh Wav2vec2 Hindi Him 4200
MIT
基於Wav2Vec2架構的印地語自動語音識別模型,由Harveen Chadha開發,在4200小時標註印地語數據上微調
語音識別 Transformers 其他
V
Harveenchadha
2,621
5
Wav2vec2 Base Voxpopuli Sv Swedish
基於Facebook的VoxPopuli-sv基礎版模型,使用NST和Common Voice數據進行微調的瑞典語語音識別模型。
語音識別 Transformers
W
KBLab
38
0
Vakyansh Wav2vec2 Punjabi Pam 10
MIT
基於CLSRIL-23多語言預訓練模型微調的旁遮普語自動語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 Transformers 其他
V
Harveenchadha
96
0
Vakyansh Wav2vec2 Tamil Tam 250
MIT
基於Wav2Vec2架構的泰米爾語自動語音識別模型,由Harveen Chadha開發,在4200小時印地語數據上微調
語音識別 Transformers 其他
V
Harveenchadha
1,843
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase