T

Trocr Large Spanish

由qantev開發
基於Transformer架構的印刷體西班牙語OCR模型,專為印刷字體優化,不支持手寫體識別
下載量 298
發布時間 : 2/22/2024

模型概述

TrOCR是一種基於Transformer的光學字符識別模型,通過圖像Transformer編碼器和文本Transformer解碼器實現圖像到文字的轉換。本版本針對西班牙語進行了專門優化。

模型特點

西班牙語優化
專門針對西班牙語文本識別進行訓練和優化
印刷體專用
專為印刷字體設計,識別印刷文本效果優異
Transformer架構
採用先進的Transformer架構,結合圖像理解和語言建模能力
大規模訓練數據
使用自建的200萬西班牙語樣本數據集訓練

模型能力

印刷體文字識別
西班牙語文本提取
圖像轉文字
多詞句識別

使用案例

文檔數字化
維基百科內容提取
從西班牙語維基百科頁面圖像中提取文本內容
商業應用
發票處理
自動識別西班牙語發票中的文本信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase