Doctr Tf Crnn Vgg16 Bn French
TensorFlow 2とPyTorchに基づく光学文字認識技術、多言語文書認識をサポート
ダウンロード数 16
リリース時間 : 4/24/2022
モデル概要
doctrは文書テキスト検出と認識のためのOCRモデルで、画像からテキスト内容を抽出できます。複数のアーキテクチャ組み合わせをサポートし、様々なシナリオの文書処理ニーズに対応します。
モデル特徴
デュアルフレームワーク対応
TensorFlow 2とPyTorchフレームワークを同時サポート、柔軟な開発選択肢を提供
モジュール設計
検出モデルと認識モデルを自由に組み合わせ可能、様々な性能ニーズに対応
軽量モデル
MobileNetなどの軽量アーキテクチャオプションを提供、モバイル端末やエッジデバイス向け
モデル能力
文書画像テキスト検出
多言語テキスト認識
エンドツーエンド文書OCR処理
使用事例
文書デジタル化
スキャン文書処理
スキャンしたPDFや画像を編集可能なテキストに変換
文書処理効率向上、紙文書のデジタル化を実現
フォーム処理
自動フォーム認識
様々なフォームから構造化データを抽出
手動入力を削減、データ収集精度を向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98