trocr-base-ru開源OCR模型 - 免費部署，高效實現俄英圖像轉文本任務

Trocr Base Ru

由sherstpasha99開發

TrOCR-Ru是基於microsoft/trocr-base-handwritten在俄語和英語合成數據集上微調的光學字符識別模型，專注於圖像轉文本任務。

下載量 30

發布時間 : 5/15/2024

模型概述

該模型主要用於光學字符識別（OCR）任務，能夠從圖像中識別並提取俄語和英語文本。

多語言支持

支持俄語和英語文本識別

高性能OCR

在HKR和西里爾數據集上表現出色，準確率最高達72.36%

大規模數據訓練

基於nastyboget提供的大規模合成數據集進行微調

圖像中的俄語文本識別

圖像中的英語文本識別

手寫體文本識別

印刷體文本識別

文檔數字化

俄語文檔掃描

將紙質俄語文檔轉換為可編輯的電子文本

準確率約70%

多語言OCR

雙語文本識別

識別同時包含俄語和英語的混合文本圖像

數據集	詳情
`nastyboget/stackmix_hkr_large`	用於模型訓練和評估的大型合成數據集。
`nastyboget/stackmix_cyrillic_large`	用於模型訓練和評估的大型合成數據集。
`nastyboget/synthetic_cyrillic_large`	用於模型訓練和評估的大型合成數據集。

指標	HKR驗證集	HKR測試集1	HKR測試集2	西裡爾字母驗證集	西裡爾字母測試集
準確率（Accuracy）	69.9947	67.4184	69.9187	72.3613	63.9249
字符錯誤率（CER）	6.7964	8.9113	6.7278	6.6403	9.2576
單詞錯誤率（WER）	21.6688	27.3849	21.6200	27.6715	33.2406