Crnn Fa Printed 96 Long
ペルシャ語に最適化されたOCRモデル、CNN+LSTMアーキテクチャに基づき、印刷体/スキャン文書向けに設計
ダウンロード数 2,886
リリース時間 : 11/27/2023
モデル概要
このモデルはペルシャ語OCRのCRNNモデルのアップグレード版で、トレーニングデータセットの拡大、入力サイズの調整、より多くの文字のサポートなどの改善により、認識精度が向上しました。
モデル特徴
強化されたデータサポート
トレーニングデータセットを5倍に拡大し、数字や特殊文字のサポートを追加
最適化された入力出力
入力画像サイズを32x384に調整し、最大出力長を96文字に向上
混合文字処理
テキストに混在する数字などの左から右への記述文字を自動処理
シーン適応性
印刷体に最適化されていますが、微調整によりナンバープレート認識や手書きテキストなどのシーンにも適用可能
モデル能力
ペルシャ語テキスト認識
印刷体文書OCR
数字と特殊文字認識
混合方向テキスト処理
使用事例
文書デジタル化
ペルシャ語文書スキャン
印刷体ペルシャ語文書を編集可能なテキストに変換
50文字以内のテキストで最高のパフォーマンス
自動処理
フォーム認識
フォーム内のペルシャ語テキストと数字情報を自動認識
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98