低字符錯誤率

# 低字符錯誤率

Phi 4 Multimodal Instruct Ko Asr

基於microsoft/Phi-4-multimodal-instruct微調的韓語自動語音識別(ASR)和語音翻譯(AST)模型，在zeroth-korean和fleurs數據集上表現優異。

文本生成音頻

Transformers 韓語

Whisper Large V3 Cantonese

基於Whisper v3微調的粵語自動語音識別模型，在Common Voice 17數據集上訓練

Transformers 其他

Japanese Wav2vec2 Large Rs35kh

基於wav2vec 2.0 Large架構，在大型日語ASR語料庫ReazonSpeech v2.0上微調而成的日語自動語音識別模型

Transformers 日語

reazon-research

基於mHuBERT-147基礎模型訓練的烏克蘭語自動語音識別模型，支持烏克蘭語語音轉文本任務。

語音識別其他

Trocr Base Handwritten OCR Handwriting Recognition V2

基於微軟trocr-base-handwritten微調的手寫體OCR模型，在評估集上字符錯誤率(CER)為0.0360

Transformers 英語

Trocr Base Printed License Plates Ocr

基於microsoft/trocr-base-printed微調的OCR模型，專門用於車牌文本識別

Transformers 英語

Trocr Base Printed Captcha Ocr

基於microsoft/trocr-base-printed微調的驗證碼OCR模型，用於從圖像驗證碼中提取文本。

Transformers 英語

Whisper Large V2 Mn 13

基於OpenAI的whisper-large-v2模型在蒙古語數據集上微調的語音識別模型，支持蒙古語自動語音識別任務。

Transformers 其他

Wav2vec2 Xlsr 300m Finnish Lm

基於facebook/wav2vec2-xls-r-300m微調的芬蘭語自動語音識別模型，使用275.6小時芬蘭語標註數據訓練，支持與KenLM語言模型配合使用。

Transformers 其他

Wav2vec2 Large Xlsr 53 Cantonese

基於facebook/wav2vec2-large-xlsr-53模型，使用Common Voice語料庫8.0版對粵語進行微調的語音識別模型

Transformers 其他

Wav2vec2 Xls R 1b Italian Doc4lm 5gram

基於XLS-R 10億參數模型微調的意大利語語音識別模型，支持帶語言模型的識別

Transformers 其他

radiogroup-crits

Wav2vec2 Xls R 300m Es

該模型是基於facebook/wav2vec2-xls-r-300m在COMMON_VOICE - ES數據集上微調的西班牙語自動語音識別模型。

Transformers 西班牙語

Wav2vec2 Xlsr 1b Finnish

基於Facebook的wav2vec2-xls-r-1b模型針對芬蘭語自動語音識別(ASR)進行微調的版本，使用259.57小時芬蘭語標註語音數據訓練

Transformers 其他

Wav2vec2 Large Xls R 1b Indonesian

基於facebook/wav2vec2-xls-r-1b在Common Voice印尼語數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Polish

針對波蘭語優化的XLSR-53大模型語音識別系統，基於facebook/wav2vec2-large-xlsr-53微調，支持波蘭語自動語音識別

語音識別其他

Wav2vec2 Xls R 1b Italian Robust

基於facebook/wav2vec2-xls-r-1b在Common Voice 7和Libri Speech數據集上微調的意大利語自動語音識別模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Finnish

基於facebook/wav2vec2-large-xlsr-53模型微調的芬蘭語自動語音識別模型，支持16kHz採樣率的語音輸入

Transformers 其他

Wav2vec2 Large Xlsr 53 Hungarian

這是一個針對匈牙利語語音識別任務微調的XLSR-53大模型，基於Common Voice和CSS10數據集訓練。

語音識別其他

Wav2vec2 Large Xlsr 53 Russian

基於facebook/wav2vec2-large-xlsr-53模型微調的俄語語音識別模型，支持16kHz採樣率的語音輸入

語音識別其他

Wav2vec2 Large Xlsr 53 Persian

針對波斯語優化的XLSR-53大模型語音識別系統，基於facebook/wav2vec2-large-xlsr-53架構微調

語音識別其他

Wav2vec2 Xls R 300m Hy

基於facebook/wav2vec2-xls-r-300m模型在亞美尼亞語數據集上微調的自動語音識別(ASR)模型，支持亞美尼亞語語音轉文字任務。

Transformers 其他

Wav2vec2 Large Xlsr 53 Greek

基於facebook/wav2vec2-large-xlsr-53模型微調的希臘語語音識別模型，支持16kHz採樣率的語音輸入。

Transformers 其他

Wav2vec2 Large Xlsr 53 Estonian

基於facebook/wav2vec2-large-xlsr-53模型，使用通用語音數據集對愛沙尼亞語進行微調的自動語音識別模型

Transformers 其他

Wav2vec2 Large Xls R 300m Bg V1

這是一個基於facebook/wav2vec2-xls-r-300m模型在保加利亞語語音數據集上微調的自動語音識別(ASR)模型。

Transformers 其他

Xlsr300m Cv 7.0 Nl Lm

XLS-R-300M 是一個基於自動語音識別（ASR）的模型，專門針對荷蘭語優化，在 Common Voice 8 荷蘭語數據集上訓練。

Transformers 其他

XLSR 300M Nynorsk

基於XLSR-300M架構的新挪威語自動語音識別模型，在NPSC數據集上訓練，具有較低的詞錯誤率和字符錯誤率。

Xlsr 300m CV 8.0 50 EP New Params Nl

這是一個基於XLS-R架構的300M參數自動語音識別(ASR)模型，專門針對荷蘭語優化，在Common Voice 8.0數據集上訓練。

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase