T

Trocr Large Handwritten Fr

由agomberto開發
針對法語手寫文本的TrOCR基礎模型,採用兩階段微調策略訓練,適用於單行文本圖像識別
下載量 806
發布時間 : 5/9/2023

模型概述

基於Transformer架構的法語手寫體光學字符識別模型,專門為處理法國檔案和人口普查等手寫文檔而設計

模型特點

法語專項優化
針對法語詞彙和姓名特徵進行訓練,特別適應法國檔案文檔
兩階段訓練策略
首先生成數據預訓練,再使用真實手寫數據集微調
混合數據集訓練
結合生成數據和真實法國人口普查/檔案數據集

模型能力

法語手寫文本識別
單行文本圖像處理
歷史文檔數字化

使用案例

檔案數字化
法國人口普查記錄轉錄
自動識別歷史人口普查表格中的手寫信息
CER 0.0575 / WER 0.1651
歷史檔案處理
對法國曆史檔案文件進行OCR處理
CER 0.09417 / WER 0.23485
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase