D

Donut Base Sroie Fine Tuned

adrianccyによって開発
naver-clova-ix/donut-baseモデルを画像フォルダデータセットで微調整したバージョンで、ドキュメント理解タスクに適しています。
ダウンロード数 21
リリース時間 : 11/22/2022

モデル概要

このモデルはDonutアーキテクチャの微調整バージョンで、ドキュメント画像理解タスク(テキスト検出、認識、情報抽出など)に特化しています。

モデル特徴

ドキュメント画像理解
ドキュメント画像に最適化された理解能力
微調整バージョン
特定のデータセットで微調整されており、特定タスクで優れた性能を発揮
Transformerアーキテクチャ
強力なTransformerアーキテクチャを基盤とした優れた特徴抽出能力

モデル能力

ドキュメント画像処理
テキスト情報抽出
視覚-言語連携理解

使用事例

ドキュメント処理
レシート情報抽出
レシート画像から金額、日付などのキー情報を抽出
表認識
ドキュメント内の表構造を認識し内容を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase