Doctr Torch Crnn Mobilenet V3 Large French
TensorFlow 2とPyTorchに基づく光学文字認識(OCR)モデルで、多言語テキストの検出と認識をサポート
ダウンロード数 33
リリース時間 : 4/24/2022
モデル概要
doctrは強力なOCRツールキットで、エンドツーエンドのテキスト検出と認識機能を提供し、画像から多言語テキストコンテンツを抽出可能
モデル特徴
デュアルフレームワーク対応
TensorFlow 2とPyTorchの両方の深層学習フレームワークを同時にサポート
エンドツーエンドOCR
完全なテキスト検出と認識プロセスを提供
多言語サポート
英語、フランス語など複数言語のテキスト認識を処理可能
軽量モデル
MobileNetV3アーキテクチャに基づき、精度と効率のバランスを実現
モデル能力
画像内のテキスト検出
多言語テキスト認識
文書画像処理
OCR結果の構造化出力
使用事例
文書デジタル化
スキャン文書変換
スキャンしたPDFや画像を編集可能なテキストに変換
紙文書のデジタル保存と検索を実現
自動データ入力
フォーム処理
フォーム内のフィールド情報を自動認識・抽出
手動データ入力作業の削減
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98