Image Text Captcha V2
microsoft/trocr-base-printedをファインチューニングした印刷テキスト認識モデルで、主にCAPTCHA認識タスクに使用されます
ダウンロード数 66
リリース時間 : 6/2/2023
モデル概要
このモデルはTrOCRベースモデルのファインチューニング版で、画像から印刷テキストを認識することに特化しており、特にCAPTCHA認識シナリオに適しています
モデル特徴
高精度CAPTCHA認識
CAPTCHAテキスト認識タスクで5.88%の低文字誤り率を達成
Transformerアーキテクチャ採用
先進的なTransformerアーキテクチャを採用し、優れたシーケンスモデリング能力を有する
ファインチューニング最適化
ベースモデルに対して特定タスク向けにファインチューニングし、性能を向上
モデル能力
画像内の印刷テキスト認識
CAPTCHA内容抽出
シーンテキスト認識
使用事例
セキュリティ認証
CAPTCHA自動認識
ウェブサイトのCAPTCHA内テキスト内容を自動認識
文字誤り率5.88%
文書デジタル化
印刷文書スキャン認識
印刷文書画像を編集可能なテキストに変換
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98