D

Donut Base Sroie

enoreyesによって開発
naver-clova-ix/donut-baseをファインチューニングした文書理解モデルで、構造化文書情報抽出タスクに特化
ダウンロード数 15
リリース時間 : 3/23/2023

モデル概要

このモデルはDonutアーキテクチャに基づく視覚-言語モデルで、スキャン文書から構造化情報を抽出するために特別に設計されています。領収書や請求書などの文書の自動処理に適しています。

モデル特徴

文書理解能力
スキャン文書内のテキストとレイアウト情報を理解可能
エンドツーエンド処理
OCR前処理不要で、画像入力から直接構造化出力へ
ファインチューニング適応
特定の文書タイプ(領収書など)に最適化

モデル能力

文書画像理解
構造化情報抽出
領収書データ処理
請求書情報認識

使用事例

文書自動化
領収書情報抽出
スキャンした領収書から店舗名、日付、金額などの情報を自動抽出
財務記録処理の自動化
請求書処理
請求書の主要フィールドを認識し構造化保存
企業財務プロセスの簡素化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase