# 低錯誤率

Trocr Finetuned 20250422 125947
MIT
針對葡萄牙語文本優化的光學字符識別(OCR)模型,基於微軟TrOCR基礎模型微調
文字識別 支持多種語言
T
mazafard
30
0
Qaari 0.1 Urdu OCR VL 2B Instruct
Qaari 0.1 Urdu是一款專門為烏爾都語文本的光學字符識別(OCR)優化的模型,基於Qwen/Qwen2-VL-2B進行微調,在烏爾都語OCR能力上有顯著提升。
文字識別
Q
oddadmix
257
1
Qari OCR 0.1 VL 2B Instruct
Apache-2.0
基於Qwen2 VL模型微調的阿拉伯語OCR模型,專為整頁阿拉伯文本識別優化
文字識別 Transformers 阿拉伯語
Q
NAMAA-Space
2,965
28
Fireredasr LLM L
Apache-2.0
FireRedASR是一系列支持普通話、中國方言和英語的開源工業級自動語音識別(ASR)模型,在公開的普通話ASR基準測試中實現了新的最先進水平(SOTA),同時具備出色的歌詞識別能力。
語音識別 支持多種語言
F
FireRedTeam
151
17
Vntl Llama3 8b V2 Imatrix Gguf
基於LLaMA3 Youko的qlora微調版本,專為日文視覺小說英譯優化的8B參數模型
機器翻譯 支持多種語言
V
Casual-Autopsy
311
1
Vntl Llama3 8b V2 Gguf
基於LLaMA 3 Youko的qlora微調版本,專精日語視覺小說英譯任務
機器翻譯 支持多種語言
V
lmg-anon
123
5
Reverb Diarization V2
其他
Reverb說話人日誌V2是一個基於pyannote-audio的說話人日誌模型,相比基準pyannote3.0模型在多個測試集上表現更優。
說話人處理
R
Revai
4,073
45
Trocr Base Printed License Plates Ocr
基於microsoft/trocr-base-printed微調的印刷體車牌OCR模型,在評估集上字符錯誤率為0.037
文字識別 Transformers
T
artbreguez
163
1
Fine Tashkeel
MIT
基於字節級微調模型的阿拉伯語精確標音系統,通過微調預訓練模型實現阿拉伯文本發音符號的自動補全。
大型語言模型 Transformers 阿拉伯語
F
basharalrfooh
335
5
Wavlm Base 960h Asv19 Deepfake
基於微軟WavLM-base微調的深度偽造音頻檢測模型,在ASVspoof 2019數據集上表現優異,準確率達99.79%
音頻分類 Transformers
W
abhishtagatya
16
0
Belle Whisper Large V3 Zh
Apache-2.0
基於whisper-large-v3微調優化的中文語音識別模型,在多箇中文語音基準測試中性能顯著提升
語音識別 Transformers
B
BELLE-2
1,666
112
Trocr Large Spanish
MIT
基於Transformer架構的印刷體西班牙語OCR模型,專為印刷字體優化,不支持手寫體識別
圖像生成文本 Transformers 支持多種語言
T
qantev
298
11
Trocr Base Printed License Plates Ocr
基於microsoft/trocr-base-printed微調的OCR模型,專門用於識別印刷體車牌號碼。
文字識別 Transformers
T
mariovigliar
202
1
Trocr Base Printed License Plates Ocr Timestamp
基於microsoft/trocr-base-printed微調的OCR模型,專門用於識別車牌和時間戳信息
文字識別 Transformers
T
PQAshwin
132
1
Sinhala Ocr Model V3
該模型是基於Ransaka/sinhala-ocr-model微調的僧伽羅語OCR模型,主要用於識別僧伽羅語文本。
文字識別 Transformers
S
Ransaka
213
2
Wespeaker Voxceleb Resnet293 LM
基於ResNet293架構的說話人嵌入模型,經過大間隔微調優化,支持說話人識別、相似度計算和語音分割等任務
說話人處理 英語
W
Wespeaker
108
3
Whisper Large V3 German
Apache-2.0
基於Whisper Large v3的德語語音識別微調模型,針對德語語音處理和識別進行了優化
語音識別 Transformers 德語
W
primeline
8,745
70
Trocr Base Printed Captcha Ocr
基於微軟trocr-base-printed模型微調的驗證碼識別模型,專門用於處理印刷體文本的OCR任務
文字識別 Transformers
T
chanelcolgate
33
1
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調,適用於日語語音識別任務。
語音識別 Transformers 日語
W
Ivydata
137
3
Arocr
ArOCR是一個阿拉伯語光學字符識別(OCR)模型,能夠將包含阿拉伯文本的圖像轉換為可編輯的文本格式。
文字識別 Transformers 阿拉伯語
A
gagan3012
77
4
Trocr Handwritten Math
該模型能夠將手寫數學表達式的圖像轉換為對應的LaTeX序列,適用於數學公式識別和數字化處理。
文字識別 Transformers
T
Azu
46
5
Wav2vec2 Large Xlsr Japanese 0325 1200
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在日語語音識別任務上微調的自動語音識別(ASR)模型。
語音識別 Transformers 日語
W
qqpann
14
0
Wav2vec2 Xls R Adult Child Cls
Apache-2.0
基於XLS-R架構的音頻分類模型,用於區分成人和兒童語音。
音頻分類 Transformers 英語
W
bookbot
20
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase