D

Donut Base Sroie

Prem11100によって開発
philschmid/donut-base-sroieをファインチューニングしたドキュメント理解モデル
ダウンロード数 13
リリース時間 : 11/3/2022

モデル概要

このモデルはDonutアーキテクチャに基づくドキュメント理解モデルで、SROIEデータセットに特化してファインチューニングされ、画像から構造化情報を抽出するために設計されています。

モデル特徴

ドキュメント画像理解
スキャンしたドキュメントや画像から構造化情報を抽出可能
エンドツーエンド処理
OCR前処理なしで画像入力から直接構造化出力を生成
ファインチューニング最適化
SROIEデータセットに特化して最適化され、レシート情報抽出性能を向上

モデル能力

画像内のテキスト認識
構造化情報抽出
レシート情報解析
エンドツーエンドドキュメント理解

使用事例

ドキュメント処理
レシート情報抽出
スキャンしたレシート画像から店舗名、日付、金額などの情報を自動抽出
表データ抽出
ドキュメント画像から表データを抽出し構造化形式に変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase