# 低字錯誤率

Phi 4 Multimodal Instruct Commonvoice Zh Tw
MIT
基於microsoft/Phi-4-multimodal-instruct微調的臺灣普通話語音識別模型,在臺灣普通話通用語音19.0數據集上訓練
音頻生成文本 Transformers 中文
P
JacobLinCool
28
1
Court Records Htr
MIT
基於微軟TrOCR微調的手寫文字識別模型,專用於19世紀芬蘭語和瑞典語法庭記錄文檔
文字識別
C
Kansallisarkisto
24
0
Belle Whisper Large V2 Zh
Apache-2.0
基於whisper-large-v2進行微調的中文語音識別模型,在多箇中文語音識別基準測試中實現了30-70%的相對性能提升。
語音識別 Transformers
B
BELLE-2
140
33
Whisper Large V2 Cantonese
Apache-2.0
基於OpenAI Whisper Large V2模型微調的粵語自動語音識別(ASR)模型,在Common Voice 11.0粵語數據集上訓練,字錯誤率(CER)為6.21%。
語音識別 Transformers 其他
W
Scrya
210
7
Whisper Large V2 Cantonese
Apache-2.0
基於OpenAI Whisper Large V2在粵語數據集上微調的自動語音識別模型,在測試集上達到6.7274%的字錯誤率
語音識別 Transformers 其他
W
simonl0909
131
12
Wav2vec2 Bloom Speech Tgl
其他
基於facebook/wav2vec2-xls-r-300m微調的他加祿語語音識別模型
語音識別 Transformers 其他
W
sil-ai
3,412
0
Bp Cetuc100 Xlsr
Apache-2.0
基於CETUC數據集針對巴西葡萄牙語進行微調的Wav2vec2模型,使用約145小時巴西葡萄牙語語音數據訓練
語音識別 Transformers 其他
B
lgris
22
0
Wav2vec2 10july
Apache-2.0
這是一個基於XLSR Wav2Vec2架構的德語自動語音識別模型,在通用語音德語數據集上進行了微調。
語音識別 Transformers 德語
W
sourabharsh
24
0
Xls R Et
Apache-2.0
基於wav2vec2-xls-r-300m架構微調的愛沙尼亞語自動語音識別模型,在Common Voice 7.0數據集上訓練
語音識別 Transformers 其他
X
shpotes
23
0
Wav2vec2 Large Xls R 300m Ru
這是一個基於Wav2Vec2 XLS-R架構的俄語自動語音識別模型,參數規模為300m,在公共語音和魯棒語音事件數據集上進行了評估。
語音識別 Transformers 其他
W
mobedkova
37
1
Xls R 300m Pt
Apache-2.0
這是一個基於Facebook的wav2vec2-xls-r-300m模型在葡萄牙語Common Voice 8.0數據集上微調的自動語音識別模型
語音識別 Transformers 其他
X
AlexN
28
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase