T

Trocr Base Printed Fr

由agomberto開發
基於Transformer的法語印刷體OCR模型,填補了TrOCR模型法語版本的空白
下載量 110
發布時間 : 5/4/2023

模型概述

這是一個法語印刷體文本識別模型,基於TrOCR架構開發,專門用於將法語印刷體圖像轉換為文本。

模型特點

法語專用OCR
專門針對法語文本識別優化的TrOCR變體,填補了原版TrOCR缺乏法語支持的空白
混合數據訓練
使用來自7個不同數據源的72.3萬條法語文本樣本進行訓練,覆蓋多種文本類型
優化的架構組合
採用DeiT視覺編碼器和CamemBERT文本解碼器的組合,相比原版TrOCR更易訓練

模型能力

印刷體法語文本識別
圖像到文本轉換
法語文檔數字化

使用案例

文檔處理
法語印刷文檔數字化
將掃描的法語文檔轉換為可編輯文本
CER 0.13, WER 0.26
法語書籍OCR
從法語書籍掃描圖像中提取文本內容
自動化處理
法語表單處理
自動識別和提取印刷體法語表單數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase