T

Trocr Large Stage1

由microsoft開發
TrOCR是一種基於Transformer的預訓練模型,用於光學字符識別(OCR)任務。
下載量 3,700
發布時間 : 3/2/2022

模型概述

TrOCR是一種編碼器-解碼器模型,由圖像Transformer編碼器和文本Transformer解碼器組成,專門用於單行文本圖像的光學字符識別。

模型特點

基於Transformer的架構
採用先進的Transformer架構,結合圖像和文本處理能力。
預訓練模型
模型權重已預訓練,可直接使用或進行微調。
單行文本識別
專門優化用於單行文本圖像的光學字符識別。

模型能力

圖像轉文本
光學字符識別
單行文本識別

使用案例

文檔數字化
掃描文檔識別
將掃描的文檔圖像轉換為可編輯文本。
自動化處理
表單處理
自動識別和提取表單中的文本信息。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase