# 通用語音數據集

Wav2vec2 Base Cv 10000
Apache-2.0
基於wav2vec2-base-cv在通用語音數據集上微調的語音識別模型,在評估集上取得了36.84%的詞錯誤率。
語音識別 Transformers
W
jiobiala24
28
0
Wav2vec2 Xls R 300m Hy AM CV8 V1
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的語音識別模型
語音識別 Transformers
W
emre
17
0
Wav2vec2 Base Checkpoint 14
Apache-2.0
基於wav2vec2架構的語音識別模型,在通用語音數據集上微調
語音識別 Transformers
W
jiobiala24
16
0
Wav2vec2 Xlsr Punjabi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用通用語音數據集對旁遮普語進行微調的自動語音識別模型
語音識別
W
gagan3012
2,433
0
Wav2vec2 Large Xlsr Frisian
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在弗里斯蘭語上進行微調的自動語音識別模型,使用通用語音數據集訓練。
語音識別
W
iarfmoose
170
0
Wav2vec2 Large Xlsr Punjabi
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在旁遮普語語音數據上微調的自動語音識別(ASR)模型。
語音識別
W
manandey
20.46k
1
Wav2vec2 Xls R 300m Es
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在COMMON_VOICE - ES數據集上微調的西班牙語自動語音識別模型。
語音識別 Transformers 西班牙語
W
samitizerxu
23
0
Wav2vec2 Large Xlsr 53 Chuvash
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的楚瓦什語自動語音識別模型,在通用語音數據集上訓練,詞錯誤率為40.01%。
語音識別 其他
W
anton-l
30
0
Common6
基於COMMON_VOICE - FA數據集微調的波斯語自動語音識別模型
語音識別 Transformers 其他
C
ghofrani
23
0
Base Spanish Asr
基於通用語音數據集訓練的西班牙語語音識別模型,採用wav2vec2架構
語音識別 Transformers
B
glob-asr
19
0
Wav2vec2 Xls R 300m Zh CN
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集ZH-CN上微調的自動語音識別(ASR)模型,支持中文普通話識別。
語音識別 Transformers 其他
W
anantoj
37
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上對蒙古語進行微調的自動語音識別模型
語音識別 Transformers 其他
W
sammy786
22
0
Wav2vec2 Large Xlrs Estonian
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在愛沙尼亞語通用語音數據集上微調的自動語音識別(ASR)模型。
語音識別 其他
W
birgermoell
18
0
Wav2vec2 Large Xlsr Hu
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型微調的匈牙利語自動語音識別(ASR)模型,使用通用語音數據集訓練。
語音識別 其他
W
gchhablani
25
0
Wav2vec2 Large Xlsr Portuguese
Apache-2.0
基於Facebook的wav2vec2-large-xlsr-53架構微調的葡萄牙語自動語音識別模型,在通用語音數據集上訓練,詞錯誤率13.77%。
語音識別 其他
W
joaoalvarenga
83
0
Wav2vec Tr Lite AG
Apache-2.0
這是一個基於XLSR Wav2Vec2架構的土耳其語自動語音識別模型,在通用語音土耳其語數據集上訓練
語音識別 其他
W
emre
26
0
Wav2vec2 Large Xlsr Luganda
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的盧幹達語語音識別模型,在通用語音數據集上訓練,詞錯誤率29.52%
語音識別 其他
W
lucio
17
1
Wav2vec2 Xlsr Multilingual 56
Apache-2.0
這是一個支持56種語言的多語言自動語音識別(ASR)模型,基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上微調而成。
語音識別 Transformers 支持多種語言
W
voidful
21.69k
30
Wav2vec2 Large Xls R 300m Spanish Small
這是一個基於wav2vec2架構的西班牙語語音識別模型,在通用語音數據集上進行了微調,詞錯誤率(WER)為0.2105。
語音識別 Transformers
W
glob-asr
58
0
Xlsr Wav2vec English
Apache-2.0
基於facebook/wav2vec2-large在通用語音數據集上進行英語微調的自動語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 Transformers 英語
X
harshit345
27
0
Wav2vec2 10july
Apache-2.0
這是一個基於XLSR Wav2Vec2架構的德語自動語音識別模型,在通用語音德語數據集上進行了微調。
語音識別 Transformers 德語
W
sourabharsh
24
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在蒙古語通用語音數據集上微調的自動語音識別模型
語音識別 其他
W
manandey
4,719
0
Wav2vec2 Large Xlsr 53 Hsb
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的上索布語語音識別模型,支持16kHz音頻輸入
語音識別 其他
W
anuragshas
23
0
Wav2vec2 Xls R 300m Urdu
Facebook的3億參數語音識別模型,針對烏爾都語進行微調,基於通用語音8.0烏爾都語數據集訓練
語音識別 Transformers
W
aasem
16
1
Wav2vec2 Large Xlsr Swedish
Apache-2.0
這是一個基於XLSR-53架構的瑞典語自動語音識別模型,在通用語音數據集上進行微調。
語音識別 其他
W
marma
24
0
Wav2vec2 Large Xlsr 53 Sah CV8
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在通用語音雅庫特語數據集上微調的語音識別模型
語音識別 Transformers 其他
W
emre
19
0
Wav2vec2 Large Xlsr Kinyarwanda Apostrophied
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在盧旺達語上的微調模型,支持預測標記代詞與元音開頭單詞縮寫的撇號
語音識別 其他
W
lucio
28
2
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的越南語自動語音識別模型,使用通用語音數據集訓練。
語音識別 其他
W
anuragshas
279
2
Wav2vec2 Cv Coral 30ep
Apache-2.0
基於Facebook的wav2vec2-large-xlsr-53模型微調的葡萄牙語語音識別模型,在通用語音數據集上訓練
語音識別 其他
W
joaoalvarenga
27
1
Wav2vec2 Large Xlsr Finnish
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53在芬蘭語上微調的自動語音識別模型,使用通用語音數據集進行訓練。
語音識別 其他
W
birgermoell
22
0
Wav2vec2 Large Xls R 300m Spanish Small
基於wav2vec2-large-xls-r-300m架構的西班牙語語音識別模型,在通用語音數據集上微調,詞錯誤率(WER)為0.1791
語音識別 Transformers
W
tomascufaro
13
0
Wav2vec2 Large Xls R 300m Greek
基於通用語音數據集訓練的希臘語語音識別模型,採用wav2vec2架構
語音識別 Transformers
W
jerrychatz
19
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的土耳其語語音識別模型
語音識別 Transformers
W
BSen
17
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase