# 低CER

Whisper Finetune Teochew
基於Whisper-medium微調的潮州話(潮汕話)正字識別模型,支持多方言口音的正字轉錄
語音識別 Safetensors Chinese
W
panlr
20
4
Thai Trocr
Apache-2.0
基於TrOCR基礎手寫體模型微調而成的泰語和英語光學字符識別模型,擅長處理手寫文本行圖像
文字識別 Transformers Supports Multiple Languages
T
openthaigpt
2,677
9
Tablecell Htr
MIT
該模型用於從表格單元格的文本行圖像中識別手寫文本,特別適用於20世紀30年代芬蘭死亡記錄和人口普查記錄中的手寫文本識別。
文字識別
T
Kansallisarkisto
39
1
Phoneme Scorer V2 Wav2vec2
Apache-2.0
基於Wav2Vec2-Base架構的自動語音識別模型,專門用於音素識別,在LJSpeech Phonemes數據集上微調
語音識別 Transformers English
P
ct-vikramanantha
167
9
Wav2vec2 Base Korean
基於Facebook的wav2vec2-base模型微調而來,專門針對韓語語音識別進行了優化,能夠將韓語語音準確地轉錄為文本。
語音識別 Transformers Korean
W
Kkonjeong
448
1
OCR TextInput Base
一個專注於金融領域的圖像轉文本模型,支持英文文本識別,主要用於處理金融文檔中的圖像內容。
文字識別 Transformers English
O
rohit5895
31
0
Pretrained Trocr Small Vietnamese Nom
一個專注于越南語語音識別的模型,支持高準確率的語音轉文本功能。
機器翻譯 Transformers Other
P
nxquang-al
19
2
Image Text Captcha V2
基於microsoft/trocr-base-printed微調的印刷體文本識別模型,主要用於驗證碼識別任務
文字識別 Transformers
I
dragonstar
66
3
Whisper Small Japanese
Apache-2.0
該模型是基於openai/whisper-small微調的日語語音識別模型,支持日語語音轉文本任務。
語音識別 Transformers Japanese
W
Ivydata
356
5
Trocr Base Printed Fr
MIT
基於Transformer的法語印刷體OCR模型,填補了TrOCR模型法語版本的空白
圖像生成文本 Transformers French
T
agomberto
110
2
Wav2vec2 Ljspeech Gruut
Apache-2.0
基於Wav2Vec2架構的音素識別模型,在LJSpeech Phonemes數據集上微調,用於將語音轉換為音素序列
語音識別 Transformers English
W
bookbot
2,484
17
Whisper Small Cantonese
Apache-2.0
基於OpenAI Whisper-small微調的粵語語音識別模型,在Common Voice 16.0測試集上CER為7.93
語音識別 Transformers Supports Multiple Languages
W
alvanlii
2,413
85
Stt Zh Conformer Transducer Large
這是一個用於轉錄普通話語音的大型Conformer-Transducer模型,參數約1.2億,在AISHELL-2數據集上訓練。
語音識別 Chinese
S
nvidia
72
13
Stt Zh Citrinet 1024 Gamma 0 25
這是一個用於中文普通話自動語音識別(ASR)的非自迴歸Citrinet模型,擁有約1.4億參數,採用字符編碼方案和CTC損失/解碼。
語音識別 Chinese
S
nvidia
92
5
Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice數據集進行微調的語音識別模型
語音識別 Transformers Chinese
W
ydshieh
127
32
Wav2vec2 Large Xlsr 53 Th
這是一個基於wav2vec2-large-xlsr-53模型在泰語通用語音7.0數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers Other
W
airesearch
110.74k
21
Wav2vec2 Bn 300m
Apache-2.0
基於facebook/wav2vec2-xls-r-300m微調的孟加拉語自動語音識別模型,使用OPENSLR_SLR53數據集訓練
語音識別 Transformers Other
W
Tahsin-Mayeesha
25
4
Xls R 300m Et
基於facebook/wav2vec2-xls-r-300m微調的愛沙尼亞語自動語音識別模型,使用約800小時多樣化數據訓練
語音識別 Transformers Other
X
TalTechNLP
58
1
Wav2vec2 Xls R 1b Ro
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在羅馬尼亞語Common Voice 7.0數據集上微調的自動語音識別模型。
語音識別 Transformers Other
W
ubamba98
16
0
Wav2vec2 Xls R 300m Cs Cv8
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在Common Voice 8.0捷克語數據集上微調的語音識別模型
語音識別 Transformers Other
W
comodoro
13
1
Wav2vec2 Xls R 1b Npsc Bokmaal
Apache-2.0
基於facebook/wav2vec2-xls-r-1b模型在挪威書面語(博克馬爾語)語音數據集上微調的自動語音識別模型
語音識別 Transformers
W
NbAiLab
23
0
Wav2vec2 Xls R Sl A1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在斯洛文尼亞語(Common Voice 8.0)數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers Other
W
DrishtiSharma
25
0
Wav2vec2 Large Xls R 300m Bg D2
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在保加利亞語數據集上微調的自動語音識別模型
語音識別 Transformers Other
W
DrishtiSharma
20
1
Xls R 1b Cv 8 Fr
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - FR數據集上微調的法語自動語音識別模型。
語音識別 Transformers French
X
Plim
26
0
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase