T

Trocr Large Handwritten

由microsoft開發
TrOCR是基於Transformer的光學字符識別模型,專為手寫文本識別設計,在IAM數據集上進行了微調。
下載量 59.17k
發布時間 : 3/2/2022

模型概述

TrOCR是一個編碼器-解碼器模型,結合了圖像Transformer和文本Transformer,適用於單行文本圖像的光學字符識別任務。

模型特點

基於Transformer架構
採用先進的Transformer架構,結合圖像和文本處理能力
預訓練模型微調
圖像編碼器從BEiT初始化,文本解碼器從RoBERTa初始化
手寫文本識別優化
專門在IAM手寫數據庫上進行了微調,適合手寫文本識別

模型能力

手寫文本識別
單行文本圖像OCR
英文文本提取

使用案例

文檔數字化
手寫筆記轉錄
將手寫筆記圖像轉換為可編輯文本
高精度識別手寫英文字符
歷史文檔處理
歷史手稿轉錄
數字化處理歷史手稿和檔案
保留原始文檔內容並轉換為可搜索文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase