T

Trocr Large Handwritten Fr

agombertoによって開発
フランス語手書きテキスト向けのTrOCR基本モデルで、2段階ファインチューニング戦略で訓練され、単一行テキスト画像認識に適している
ダウンロード数 806
リリース時間 : 5/9/2023

モデル概要

Transformerアーキテクチャに基づくフランス語手書き体光学文字認識モデルで、フランスのアーカイブや国勢調査などの手書き文書処理に特化して設計されている

モデル特徴

フランス語特化最適化
フランス語の語彙や名前の特徴に特化して訓練され、特にフランスのアーカイブ文書に適応している
2段階訓練戦略
最初に生成データで事前訓練し、その後実際の手書きデータセットでファインチューニングする
混合データセット訓練
生成データと実際のフランス国勢調査/アーカイブデータセットを組み合わせている

モデル能力

フランス語手書きテキスト認識
単一行テキスト画像処理
歴史文書のデジタル化

使用事例

アーカイブのデジタル化
フランス国勢調査記録の転写
歴史的な国勢調査フォームの手書き情報を自動認識
CER 0.0575 / WER 0.1651
歴史アーカイブ処理
フランスの歴史アーカイブ文書に対してOCR処理を実施
CER 0.09417 / WER 0.23485
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase