trocr-base-printed_captcha_ocrオープンソースキャプチャOCRモデル - 画像キャプチャからテキストを効率的に抽出する

ホーム

Trocr Base Printed Captcha Ocr

DunnBC22によって開発

microsoft/trocr-base-printedを基に微調整したキャプチャOCRモデルで、画像キャプチャからテキストを抽出します。

文字認識

Transformers

英語#キャプチャ認識 #低文字誤り率 #印刷体OCR

ダウンロード数 272

リリース時間 : 1/13/2023

モデル概要

このモデルは、画像キャプチャ内のテキスト内容を認識し抽出するために特別に設計されており、複雑なキャプチャ認識問題を解決する能力を示しています。

モデル特徴

高精度キャプチャ認識

評価セットで0.0075の文字誤り率を達成し、優れた性能を示しています。

TrOCRアーキテクチャに基づく

Transformer-based OCRアーキテクチャを採用し、視覚と言語処理能力を組み合わせています。

軽量な微調整

事前訓練済みモデルを基に微調整し、少量の訓練データで良好な効果を得られます。

モデル能力

画像キャプチャテキスト認識

英語テキスト抽出

印刷体文字認識

使用事例

セキュリティ検証

キャプチャ自動認識

自動テストにおけるキャプチャの自動認識と入力に使用されます。

文字誤り率0.0075

データ収集

キャプチャデータセットの注釈

キャプチャデータセットの自動注釈作業を支援します。

🚀 trocr-base-printed_captcha_ocr

このモデルは、画像からテキストを抽出するためのモデルです。未知のデータセットでmicrosoft/trocr-base-printedをファインチューニングしたものです。評価セットでは、以下の結果を達成しています。

損失: 0.1380
文字誤り率(Cer): 0.0075

🚀 クイックスタート

このモデルは、画像のキャプチャ入力からテキストを抽出します。作成方法の詳細については、次のリンクを参照してください。https://github.com/DunnBC22/Vision_Audio_and_Multimodal_Projects/blob/main/Optical%20Character%20Recognition%20(OCR)/Captcha/OCR_captcha.ipynb