T

Trocr Small Handwritten

由microsoft開發
TrOCR是一個基於Transformer的光學字符識別模型,專門用於手寫文本圖像的識別。
下載量 517.96k
發布時間 : 3/2/2022

模型概述

TrOCR模型是一個編碼器-解碼器模型,由圖像Transformer編碼器和文本Transformer解碼器組成,專門用於單行文本圖像的光學字符識別(OCR)。

模型特點

基於Transformer架構
採用先進的Transformer架構,結合圖像和文本處理能力,實現高效OCR。
預訓練模型微調
圖像編碼器基於DeiT預訓練,文本解碼器基於UniLM預訓練,在IAM手寫數據集上微調。
端到端識別
直接從圖像輸入到文本輸出,無需複雜的預處理步驟。

模型能力

手寫文本識別
單行文本圖像處理
英語字符識別

使用案例

文檔數字化
手寫筆記轉錄
將手寫筆記圖像轉換為可編輯的文本格式
準確識別IAM測試集中的手寫文本
歷史檔案處理
歷史手稿轉錄
數字化處理歷史手寫文檔
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase