T

Trocr Small Spanish

qantevによって開発
Transformerアーキテクチャに基づいて最適化されたスペイン語活字OCRモデル、手書き文字認識は非対応
ダウンロード数 270
リリース時間 : 2/22/2024

モデル概要

TrOCR小型モデルはスペイン語の活字テキスト認識に特化して最適化され、視覚TransformerエンコーダーとテキストTransformerデコーダーアーキテクチャを採用し、独自データセットでファインチューニングを実現

モデル特徴

スペイン語特化最適化
200万件のスペイン語サンプルからなる独自データセットでトレーニングされ、活字文字認識に最適化
効率的なアーキテクチャ設計
画像Transformerエンコーダーで視覚的特徴を抽出し、テキストTransformerデコーダーでシーケンスを生成、エンドツーエンド認識を実現
リアルタイムデータ拡張
トレーニング時に動的に拡張画像を生成し、事前保存画像方式に比べて効率が大幅に向上

モデル能力

活字文字認識
スペイン語テキスト抽出
短文レベルのOCR処理
画像からテキストへの変換

使用事例

ドキュメントデジタル化
ウィキペディアコンテンツ抽出
スペイン語ウィキペディアページ画像からテキスト内容を抽出
文字誤り率6.32%(大型モデル)
フォーム処理
XFUNDデータセット処理
スペイン語フォームドキュメントのテキスト認識
EasyOCRを大幅に上回る(CER12.84%低下)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase