低字錯誤率

# 低字錯誤率

Phi 4 Multimodal Instruct Commonvoice Zh Tw

基於microsoft/Phi-4-multimodal-instruct微調的臺灣普通話語音識別模型，在臺灣普通話通用語音19.0數據集上訓練

音頻生成文本

Transformers 中文

Court Records Htr

基於微軟TrOCR微調的手寫文字識別模型，專用於19世紀芬蘭語和瑞典語法庭記錄文檔

Kansallisarkisto

Belle Whisper Large V2 Zh

基於whisper-large-v2進行微調的中文語音識別模型，在多箇中文語音識別基準測試中實現了30-70%的相對性能提升。

Whisper Large V2 Cantonese

基於OpenAI Whisper Large V2模型微調的粵語自動語音識別(ASR)模型，在Common Voice 11.0粵語數據集上訓練，字錯誤率(CER)為6.21%。

Transformers 其他

Whisper Large V2 Cantonese

基於OpenAI Whisper Large V2在粵語數據集上微調的自動語音識別模型，在測試集上達到6.7274%的字錯誤率

Transformers 其他

Wav2vec2 Bloom Speech Tgl

基於facebook/wav2vec2-xls-r-300m微調的他加祿語語音識別模型

Transformers 其他

Bp Cetuc100 Xlsr

基於CETUC數據集針對巴西葡萄牙語進行微調的Wav2vec2模型，使用約145小時巴西葡萄牙語語音數據訓練

Transformers 其他

Wav2vec2 10july

這是一個基於XLSR Wav2Vec2架構的德語自動語音識別模型，在通用語音德語數據集上進行了微調。

Transformers 德語

基於wav2vec2-xls-r-300m架構微調的愛沙尼亞語自動語音識別模型，在Common Voice 7.0數據集上訓練

Transformers 其他

Wav2vec2 Large Xls R 300m Ru

這是一個基於Wav2Vec2 XLS-R架構的俄語自動語音識別模型，參數規模為300m，在公共語音和魯棒語音事件數據集上進行了評估。

Transformers 其他

這是一個基於Facebook的wav2vec2-xls-r-300m模型在葡萄牙語Common Voice 8.0數據集上微調的自動語音識別模型

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase