OCR Corrector
O
OCR Corrector
由DeepMount00開發
該模型是專為意大利語設計的實驗性序列到序列架構,旨在修正低質量光學字符識別(OCR)系統在意大利文本上產生的約93%的錯誤。
下載量 20
發布時間 : 4/10/2024
模型概述
通過輸入原始的OCR掃描文本,模型將輸出修正後的文本版本,顯著減少錯誤並提升可讀性和準確性。
模型特點
高準確率
能夠修正約93%的OCR錯誤,顯著提升文本質量。
意大利語專用
專門針對意大利語文本訓練,優化了意大利語OCR錯誤的修正能力。
序列到序列架構
採用序列到序列(Seq2Seq)架構,適合處理文本轉換任務。
模型能力
OCR文本糾錯
意大利語文本修正
序列到序列文本轉換
使用案例
歷史文獻數字化
意大利歷史文獻修正
處理掃描質量低、OCR錯誤率高的意大利歷史文獻,提升數字化文本的準確性。
修正約93%的OCR錯誤
檔案管理
檔案文本修正
修正檔案掃描文本中的OCR錯誤,提高檔案的可讀性和可用性。
顯著減少錯誤並提升可讀性
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98