T

Trocr Small Printed

由microsoft開發
TrOCR是一個基於Transformer的光學字符識別模型,適用於單行文本圖像的OCR任務。
下載量 20.88k
發布時間 : 3/2/2022

模型概述

TrOCR模型是一個編碼器-解碼器模型,由圖像Transformer作為編碼器,文本Transformer作為解碼器組成。該模型在SROIE數據集上進行了微調,專門用於印刷體文本識別。

模型特點

基於Transformer架構
採用Transformer編碼器-解碼器結構,結合了圖像和文本處理能力
印刷體文本優化
專門針對印刷體文本進行了微調,識別效果更佳
端到端OCR
直接從圖像到文本的端到端識別,無需複雜的預處理步驟

模型能力

印刷體文本識別
單行文本OCR
圖像轉文本

使用案例

文檔數字化
收據識別
自動識別收據上的印刷體文本信息
高準確率的文本提取
發票處理
從發票圖像中提取關鍵信息
提高數據處理效率
自動化辦公
表格識別
識別印刷體表格中的文字內容
簡化數據錄入流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase