Donut Demo
D
Donut Demo
lucky-vermaによって開発
Donutアーキテクチャに基づくTransformerモデルで、運転免許証画像から構造化情報を抽出するために特別に設計
ダウンロード数 45
リリース時間 : 1/4/2023
モデル概要
このモデルはDonut(Document Understanding Transformer)アーキテクチャを採用し、運転免許証画像から氏名、証券番号、有効期限などの主要フィールド情報を自動的に認識・抽出し、ドキュメント情報の自動処理を実現します。
モデル特徴
エンドツーエンドドキュメント理解
OCR前処理不要で、画像入力を直接処理し構造化情報を出力
高精度抽出
運転免許証分野に特化して最適化され、主要フィールド抽出において高い精度を発揮
複数フィールド認識
氏名、証券番号、有効期限など複数のフィールド情報を同時に認識可能
モデル能力
画像内テキスト認識
構造化情報抽出
運転免許証フィールド解析
エンドツーエンドドキュメント処理
使用事例
証明書処理自動化
運転免許証情報入力システム
ユーザーがアップロードした運転免許証写真から情報を自動抽出し、手動入力を削減
データ入力効率向上、人的ミス率低減
本人確認プロセス
ユーザー登録や確認プロセスで運転免許証情報を迅速に取得
確認プロセス簡素化、ユーザー体験向上
データ整理・分析
運転免許証データベース構築
大量の運転免許証画像を一括処理し、構造化データベースを構築
ドキュメントデータのデジタル管理実現
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98