T

Trocr Base Spanish

qantevによって開発
TrOCRベースモデル、スペイン語印刷字体向けに設計、Transformerアーキテクチャに基づき、独自データセットで微調整
ダウンロード数 170
リリース時間 : 2/22/2024

モデル概要

Transformerベースの光学文字認識モデル、印刷体画像をテキストに変換する用途、手書き体認識は非対応

モデル特徴

スペイン語最適化
200万スペイン語サンプルの独自データセットで微調整、スペイン語OCR性能を専門に最適化
動的画像生成
トレーニング過程で動的画像生成技術を採用、事前保存画像方式より効率的
印刷体専用
印刷字体に特化して設計、手書き体認識は非対応

モデル能力

印刷体画像からテキスト変換
スペイン語OCR
短いテキスト認識(最大10単語)

使用事例

文書デジタル化
ウィキペディアコンテンツ抽出
スペイン語ウィキペディアページ画像からテキスト内容を抽出
フォーム処理
XFUNDデータセット処理
スペイン語XFUNDデータセット内のフォーム画像を処理
CER 0.0732 / WER 0.2028
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase