# 低字符錯誤率

Phi 4 Multimodal Instruct Ko Asr
基於microsoft/Phi-4-multimodal-instruct微調的韓語自動語音識別(ASR)和語音翻譯(AST)模型,在zeroth-korean和fleurs數據集上表現優異。
文本生成音頻 Transformers 韓語
P
junnei
354
3
Whisper Large V3 Cantonese
Apache-2.0
基於Whisper v3微調的粵語自動語音識別模型,在Common Voice 17數據集上訓練
語音識別 Transformers 其他
W
khleeloo
25
4
Japanese Wav2vec2 Large Rs35kh
Apache-2.0
基於wav2vec 2.0 Large架構,在大型日語ASR語料庫ReazonSpeech v2.0上微調而成的日語自動語音識別模型
語音識別 Transformers 日語
J
reazon-research
244
1
Hubert Uk
基於mHuBERT-147基礎模型訓練的烏克蘭語自動語音識別模型,支持烏克蘭語語音轉文本任務。
語音識別 其他
H
Yehor
31
4
Trocr Base Handwritten OCR Handwriting Recognition V2
基於微軟trocr-base-handwritten微調的手寫體OCR模型,在評估集上字符錯誤率(CER)為0.0360
文字識別 Transformers 英語
T
DunnBC22
269
16
Trocr Base Printed License Plates Ocr
基於microsoft/trocr-base-printed微調的OCR模型,專門用於車牌文本識別
文字識別 Transformers 英語
T
DunnBC22
517
9
Trocr Base Printed Captcha Ocr
基於microsoft/trocr-base-printed微調的驗證碼OCR模型,用於從圖像驗證碼中提取文本。
文字識別 Transformers 英語
T
DunnBC22
272
8
Whisper Large V2 Mn 13
Apache-2.0
基於OpenAI的whisper-large-v2模型在蒙古語數據集上微調的語音識別模型,支持蒙古語自動語音識別任務。
語音識別 Transformers 其他
W
bayartsogt
161
6
Wav2vec2 Xlsr 300m Finnish Lm
Apache-2.0
基於facebook/wav2vec2-xls-r-300m微調的芬蘭語自動語音識別模型,使用275.6小時芬蘭語標註數據訓練,支持與KenLM語言模型配合使用。
語音識別 Transformers 其他
W
Finnish-NLP
28.39k
0
Wav2vec2 Large Xlsr 53 Cantonese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用Common Voice語料庫8.0版對粵語進行微調的語音識別模型
語音識別 Transformers 其他
W
CAiRE
1,214
3
Wav2vec2 Xls R 1b Italian Doc4lm 5gram
Apache-2.0
基於XLS-R 10億參數模型微調的意大利語語音識別模型,支持帶語言模型的識別
語音識別 Transformers 其他
W
radiogroup-crits
19
1
Wav2vec2 Xls R 300m Es
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在COMMON_VOICE - ES數據集上微調的西班牙語自動語音識別模型。
語音識別 Transformers 西班牙語
W
samitizerxu
23
0
Wav2vec2 Xlsr 1b Finnish
Apache-2.0
基於Facebook的wav2vec2-xls-r-1b模型針對芬蘭語自動語音識別(ASR)進行微調的版本,使用259.57小時芬蘭語標註語音數據訓練
語音識別 Transformers 其他
W
aapot
18
0
Wav2vec2 Large Xls R 1b Indonesian
Apache-2.0
基於facebook/wav2vec2-xls-r-1b在Common Voice印尼語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
kingabzpro
14
1
Wav2vec2 Large Xlsr 53 Polish
Apache-2.0
針對波蘭語優化的XLSR-53大模型語音識別系統,基於facebook/wav2vec2-large-xlsr-53微調,支持波蘭語自動語音識別
語音識別 其他
W
jonatasgrosman
412.13k
11
Wav2vec2 Xls R 1b Italian Robust
Apache-2.0
基於facebook/wav2vec2-xls-r-1b在Common Voice 7和Libri Speech數據集上微調的意大利語自動語音識別模型
語音識別 Transformers 其他
W
dbdmg
130
0
Wav2vec2 Large Xlsr 53 Finnish
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的芬蘭語自動語音識別模型,支持16kHz採樣率的語音輸入
語音識別 Transformers 其他
W
vasilis
27
0
Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
這是一個針對匈牙利語語音識別任務微調的XLSR-53大模型,基於Common Voice和CSS10數據集訓練。
語音識別 其他
W
jonatasgrosman
127.73k
9
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的俄語語音識別模型,支持16kHz採樣率的語音輸入
語音識別 其他
W
jonatasgrosman
3.9M
54
Wav2vec2 Large Xlsr 53 Persian
Apache-2.0
針對波斯語優化的XLSR-53大模型語音識別系統,基於facebook/wav2vec2-large-xlsr-53架構微調
語音識別 其他
W
jonatasgrosman
257.76k
22
Wav2vec2 Xls R 300m Hy
Apache-2.0
基於facebook/wav2vec2-xls-r-300m模型在亞美尼亞語數據集上微調的自動語音識別(ASR)模型,支持亞美尼亞語語音轉文字任務。
語音識別 Transformers 其他
W
arampacha
25
0
Wav2vec2 Large Xlsr 53 Greek
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的希臘語語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 Transformers 其他
W
vasilis
25
0
Wav2vec2 Large Xlsr 53 Estonian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用通用語音數據集對愛沙尼亞語進行微調的自動語音識別模型
語音識別 Transformers 其他
W
vasilis
26
0
Wav2vec2 Large Xls R 300m Bg V1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在保加利亞語語音數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
DrishtiSharma
16
1
Xlsr300m Cv 7.0 Nl Lm
Apache-2.0
XLS-R-300M 是一個基於自動語音識別(ASR)的模型,專門針對荷蘭語優化,在 Common Voice 8 荷蘭語數據集上訓練。
語音識別 Transformers 其他
X
Iskaj
23
0
XLSR 300M Nynorsk
Apache-2.0
基於XLSR-300M架構的新挪威語自動語音識別模型,在NPSC數據集上訓練,具有較低的詞錯誤率和字符錯誤率。
語音識別 Transformers
X
NbAiLab
22
0
Xlsr 300m CV 8.0 50 EP New Params Nl
Apache-2.0
這是一個基於XLS-R架構的300M參數自動語音識別(ASR)模型,專門針對荷蘭語優化,在Common Voice 8.0數據集上訓練。
語音識別 Transformers 其他
X
Iskaj
25
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase