crnn-base-fa-v2オープンソースOCRモデル - ペルシャ語の印刷/スキャン文書および数字記号を専門的に認識

ホーム

Crnn Base Fa V2

hezaraiによって開発

ペルシア語向けのOCRモデルで、CNN+LSTMアーキテクチャに基づき、印刷/スキャン文書に最適化され、数字や特殊文字の認識をサポートします。

文字認識その他オープンソースライセンス:Apache-2.0 #ペルシア語OCR #印刷文書認識 #CRNNアーキテクチャ

ダウンロード数 3,096

リリース時間 : 11/27/2023

モデル概要

このモデルはペルシア語OCRのCRNNモデルのアップグレード版で、データセットの拡大、入力サイズの調整、より多くの文字のサポートなどの改善により、認識性能が向上しています。

モデル特徴

拡張されたデータセット

トレーニングデータセットの規模を5倍に拡大し、モデルの汎化能力を向上

最適化された入力サイズ

入力画像サイズを64x256から32x384に調整し、文書認識に適した形式に

拡張された文字サポート

数字や特殊文字の認識をサポートし、テキストに埋め込まれたLTR文字を自動処理可能

長さ適応性

最大出力長を64から96に増加し、より長いテキストを処理可能

モデル能力

ペルシア語テキスト認識

印刷/スキャン文書OCR

数字認識

特殊文字認識

使用事例

文書処理

ペルシア語文書のデジタル化

印刷またはスキャンされたペルシア語文書を編集可能なテキストに変換

50文字以内のテキストで最高のパフォーマンスを発揮

その他の応用シナリオ

ナンバープレート認識

微調整によりペルシア語のナンバープレート認識に適用可能

手書きテキスト認識

微調整によりペルシア語の手書きテキスト認識に適用可能

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Crnn Base Fa V2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ペルシャ語OCR用CRNNモデル

🚀 クイックスタート

インストール

使用例

📄 ライセンス