T

Trocr Base Handwritten

由microsoft開發
TrOCR是一種基於Transformer的光學字符識別模型,專門用於手寫文本識別。
下載量 206.74k
發布時間 : 3/2/2022

模型概述

TrOCR模型是一種編碼器-解碼器模型,結合了圖像Transformer和文本Transformer,專門針對單行文本圖像的光學字符識別任務進行了優化。

模型特點

基於Transformer架構
採用先進的Transformer架構,結合圖像和文本處理能力
預訓練模型微調
圖像編碼器基於BEiT預訓練,文本解碼器基於RoBERTa預訓練
手寫文本識別優化
專門在IAM手寫數據集上進行了微調,適合手寫文本識別

模型能力

手寫文本識別
單行文本圖像處理
光學字符識別

使用案例

文檔數字化
手寫筆記轉錄
將手寫筆記轉換為可編輯的文本格式
歷史文檔處理
歷史手稿轉錄
數字化處理歷史手寫文檔
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase