L

Layoutlmv2 Base Uncased Finetuned Docvqa V2

Developed by MariaK
このモデルはmicrosoft/layoutlmv2-base-uncasedをドキュメント視覚QAタスクでファインチューニングしたバージョンで、ドキュメント画像内のテキストとレイアウト情報の処理に特化しています。
Downloads 54
Release Time : 2/9/2023

Model Overview

LayoutLMv2モデルはテキスト、レイアウト、視覚情報を組み合わせ、ドキュメント理解タスクに特化しています。このファインチューニング版はドキュメント視覚QA(DocVQA)タスク向けに最適化されています。

Model Features

マルチモーダル理解
ドキュメント内のテキスト内容、空間レイアウト、視覚的特徴を同時に処理
ドキュメントQA能力
ドキュメント画像内の質問に対して正確なテキスト回答を提供
レイアウト認識
ドキュメント内のテキストの空間配置関係を理解し、意味理解を強化

Model Capabilities

ドキュメント画像理解
視覚QA
テキストレイアウト分析
マルチモーダル情報処理

Use Cases

ドキュメント処理
フォーム情報抽出
スキャンしたフォームドキュメントから特定フィールド情報を抽出
契約書分析
契約書ドキュメントの内容に関する特定質問に回答
教育
答案自動採点
学生の答案を分析し、採点関連の質問に回答
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase