I

Image Text Captcha V2

dragonstarによって開発
microsoft/trocr-base-printedをファインチューニングした印刷テキスト認識モデルで、主にCAPTCHA認識タスクに使用されます
ダウンロード数 66
リリース時間 : 6/2/2023

モデル概要

このモデルはTrOCRベースモデルのファインチューニング版で、画像から印刷テキストを認識することに特化しており、特にCAPTCHA認識シナリオに適しています

モデル特徴

高精度CAPTCHA認識
CAPTCHAテキスト認識タスクで5.88%の低文字誤り率を達成
Transformerアーキテクチャ採用
先進的なTransformerアーキテクチャを採用し、優れたシーケンスモデリング能力を有する
ファインチューニング最適化
ベースモデルに対して特定タスク向けにファインチューニングし、性能を向上

モデル能力

画像内の印刷テキスト認識
CAPTCHA内容抽出
シーンテキスト認識

使用事例

セキュリティ認証
CAPTCHA自動認識
ウェブサイトのCAPTCHA内テキスト内容を自動認識
文字誤り率5.88%
文書デジタル化
印刷文書スキャン認識
印刷文書画像を編集可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase