Trocr Base Printed
TrOCR是基於Transformer的光學字符識別模型,專為單行文本圖像識別設計,採用編碼器-解碼器架構
Downloads 184.84k
Release Time : 3/2/2022
Model Overview
該模型結合了圖像Transformer編碼器和文本Transformer解碼器,適用於印刷體文本的光學字符識別任務,特別針對SROIE數據集進行了微調
Model Features
Transformer架構
採用先進的Transformer架構處理圖像和文本序列,實現端到端OCR
預訓練權重初始化
圖像編碼器使用BEiT預訓練權重,文本解碼器使用RoBERTa預訓練權重
印刷體文本優化
專門針對印刷體文本識別進行了優化,在SROIE數據集上表現良好
Model Capabilities
單行文本圖像識別
印刷體字符識別
端到端OCR處理
Use Cases
文檔數字化
收據識別
自動識別掃描收據中的文本信息
在SROIE數據集上表現良好
發票處理
從發票圖像中提取關鍵字段信息
適用於結構化文檔處理
自動化辦公
表格識別
將印刷體表格轉換為可編輯文本
適合處理格式規範的文檔
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98