T

Trocr Small Stage1

由microsoft開發
TrOCR是基於Transformer的預訓練光學字符識別模型,採用編碼器-解碼器架構,適用於單行文本圖像的OCR任務。
下載量 3,713
發布時間 : 3/2/2022

模型概述

TrOCR模型結合圖像Transformer編碼器和文本Transformer解碼器,能夠將圖像中的文本轉換為可讀的文本內容。

模型特點

基於Transformer的架構
採用先進的Transformer架構處理圖像和文本,結合了DeiT和UniLM的優勢。
預訓練模型
提供預訓練權重,可直接用於OCR任務或作為基礎模型進行微調。
單行文本識別
專門優化用於單行文本圖像的光學字符識別任務。

模型能力

圖像轉文本
光學字符識別
單行文本識別

使用案例

文檔數字化
掃描文檔識別
將掃描的文檔圖像轉換為可編輯的文本內容
高精度的文本轉換效果
自動化處理
表單處理
自動識別和提取表單中的文本信息
提高數據處理效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase