T

Trocr Base Spanish

由qantev開發
TrOCR基礎版模型,專為西班牙語印刷字體設計,基於Transformer架構,在自建數據集上微調
下載量 170
發布時間 : 2/22/2024

模型概述

基於Transformer的光學字符識別模型,用於將印刷體圖像轉換為文本,不支持手寫體識別

模型特點

西班牙語優化
在200萬西班牙語樣本的自建數據集上微調,專門優化西班牙語OCR性能
動態圖像生成
訓練過程中採用動態圖像生成技術,相比預存圖像方式效率更高
印刷體專用
專門針對印刷字體設計,不支持手寫體識別

模型能力

印刷體圖像轉文本
西班牙語OCR
短文本識別(最多10個單詞)

使用案例

文檔數字化
維基百科內容提取
從西班牙語維基百科頁面圖像中提取文本內容
表單處理
XFUND數據集處理
處理西班牙語XFUND數據集中的表單圖像
CER 0.0732 / WER 0.2028
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase