T

Trocr Base Printed Fr

Developed by agomberto
基於Transformer的法語印刷體OCR模型,填補了TrOCR模型法語版本的空白
Downloads 110
Release Time : 5/4/2023

Model Overview

這是一個法語印刷體文本識別模型,基於TrOCR架構開發,專門用於將法語印刷體圖像轉換為文本。

Model Features

法語專用OCR
專門針對法語文本識別優化的TrOCR變體,填補了原版TrOCR缺乏法語支持的空白
混合數據訓練
使用來自7個不同數據源的72.3萬條法語文本樣本進行訓練,覆蓋多種文本類型
優化的架構組合
採用DeiT視覺編碼器和CamemBERT文本解碼器的組合,相比原版TrOCR更易訓練

Model Capabilities

印刷體法語文本識別
圖像到文本轉換
法語文檔數字化

Use Cases

文檔處理
法語印刷文檔數字化
將掃描的法語文檔轉換為可編輯文本
CER 0.13, WER 0.26
法語書籍OCR
從法語書籍掃描圖像中提取文本內容
自動化處理
法語表單處理
自動識別和提取印刷體法語表單數據
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase