Trocr Large Printed E13b Tesseract MICR Ocr
基於microsoft/trocr-large-printed微調的OCR模型,專用於識別E13B MICR字體字符
下載量 450
發布時間 : 7/22/2023
模型概述
該模型是針對E13B MICR字體優化的光學字符識別(OCR)模型,在識別銀行支票等金融文檔中的磁性墨水字符方面表現優異。
模型特點
高精度MICR識別
專為E13B MICR字體優化,在測試集上達到0.0036的極低字符錯誤率(CER)
基於TrOCR架構
利用Transformer架構的強大特徵提取能力,實現高精度字符識別
輕量級微調
僅需2個訓練輪次即可達到優異性能,展示高效遷移學習能力
模型能力
E13B MICR字體識別
金融文檔處理
高精度字符識別
使用案例
金融銀行業務
支票處理
自動識別支票底部的MICR編碼信息
字符錯誤率僅0.36%
金融文檔數字化
將包含MICR編碼的紙質文檔轉換為可搜索的數字文本
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98