D

Donut Demo

lucky-vermaによって開発
Donutアーキテクチャに基づくTransformerモデルで、運転免許証画像から構造化情報を抽出するために特別に設計
ダウンロード数 45
リリース時間 : 1/4/2023

モデル概要

このモデルはDonut(Document Understanding Transformer)アーキテクチャを採用し、運転免許証画像から氏名、証券番号、有効期限などの主要フィールド情報を自動的に認識・抽出し、ドキュメント情報の自動処理を実現します。

モデル特徴

エンドツーエンドドキュメント理解
OCR前処理不要で、画像入力を直接処理し構造化情報を出力
高精度抽出
運転免許証分野に特化して最適化され、主要フィールド抽出において高い精度を発揮
複数フィールド認識
氏名、証券番号、有効期限など複数のフィールド情報を同時に認識可能

モデル能力

画像内テキスト認識
構造化情報抽出
運転免許証フィールド解析
エンドツーエンドドキュメント処理

使用事例

証明書処理自動化
運転免許証情報入力システム
ユーザーがアップロードした運転免許証写真から情報を自動抽出し、手動入力を削減
データ入力効率向上、人的ミス率低減
本人確認プロセス
ユーザー登録や確認プロセスで運転免許証情報を迅速に取得
確認プロセス簡素化、ユーザー体験向上
データ整理・分析
運転免許証データベース構築
大量の運転免許証画像を一括処理し、構造化データベースを構築
ドキュメントデータのデジタル管理実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase