doctr-dummy-torch-crnn-mobilenet-v3-smallオープンソースOCRモデル - 無料で文書画像のテキストを識別してデプロイする

ホーム

Doctr Dummy Torch Crnn Mobilenet V3 Small

Felix92によって開発

TensorFlow 2とPyTorchベースの光学文字認識(OCR)モデル、文書画像内のテキスト検出と認識をサポート

文字認識

Transformers

英語#マルチフレームワークOCR #文書画像認識 #モバイル最適化

ダウンロード数 125

リリース時間 : 4/14/2022

モデル概要

doctrは強力なOCRツールキットで、エンドツーエンドのテキスト認識ソリューションを提供し、文書画像からテキスト内容を検出・認識可能

モデル特徴

デュアルフレームワーク対応

TensorFlow 2とPyTorch両方の深層学習フレームワークを同時サポート

モジュール設計

異なる検出・認識モデルアーキテクチャを柔軟に組み合わせ可能

エンドツーエンドソリューション

画像入力からテキスト出力までの完全なOCRプロセスを提供

モデル能力

文書画像処理

テキスト検出

テキスト認識

多言語OCR

使用事例

文書デジタル化

スキャン文書変換

スキャンしたPDFや画像を編集可能なテキストに変換

文書処理効率の向上

フォーム処理

自動フォーム認識

様々なフォームから構造化データを抽出

手動データ入力の削減

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Doctr Dummy Torch Crnn Mobilenet V3 Small

モデル概要

モデル特徴

モデル能力

使用事例

🚀 光学文字認識 (OCR) ライブラリ

🚀 クイックスタート

💻 使用例

基本的な使用法