L

Layoutlmv2 Base Uncased Finetuned Docvqa

tiennvcsによって開発
LayoutLMv2アーキテクチャに基づく文書ビジュアル質問応答モデルで、文書理解タスクに対して微調整されています。
ダウンロード数 983
リリース時間 : 3/2/2022

モデル概要

このモデルはLayoutLMv2アーキテクチャに基づく事前学習モデルで、文書ビジュアル質問応答(DocVQA)タスクに特化して微調整されています。文書内のテキスト内容とレイアウト情報を理解し、文書内容に関連する質問に回答することができます。

モデル特徴

文書レイアウト理解
テキスト内容と文書レイアウト情報を同時に処理することができます。
ビジュアル質問応答能力
文書画像内容に基づく質問に回答することができます。
微調整最適化
DocVQAタスクに対して特別に微調整されています。

モデル能力

文書内容理解
ビジュアル質問応答
文書レイアウト分析

使用事例

文書処理
フォーム情報抽出
スキャンされたフォームから特定の情報を抽出します。
契約書分析
契約条項に関する具体的な質問に回答します。
教育
試験用紙採点
スキャンされた学生の試験用紙を自動採点します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase