L

Layoutlmv3 Base Finetuned Funsd

HYPJUDYによって開発
LayoutLMv3-baseモデルをFUNSDデータセットでファインチューニングしたドキュメントAIモデルで、フォーム理解タスクに使用されます
ダウンロード数 329
リリース時間 : 4/18/2022

モデル概要

このモデルはマイクロソフトのLayoutLMv3のファインチューニング版で、ドキュメント画像内のテキストとレイアウト理解に特化しており、特にフォーム理解タスクに適しています。

モデル特徴

統一テキスト画像処理
統一されたテキストと画像マスキング戦略を採用し、ドキュメント内のテキスト内容と視覚的レイアウト情報を同時に処理可能
フォーム理解最適化
FUNSDデータセットでファインチューニングされ、フォームドキュメントの理解能力を特別に最適化
マルチモーダル事前学習
テキスト、レイアウト、画像情報を組み合わせた事前学習により、ドキュメント理解能力を強化

モデル能力

ドキュメント画像理解
フォームフィールド認識
テキストレイアウト分析
ドキュメントエンティティ認識

使用事例

ドキュメント処理
フォーム自動処理
フォーム内のフィールドと内容を自動認識・抽出
FUNSDテストセットで90.59 F1スコアを達成
ドキュメント構造分析
ドキュメントのレイアウト構造とテキスト関係を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase