L

Layoutlmv2 Base Uncased Finetuned Docvqa

Developed by madiltalay
LayoutLMv2アーキテクチャに基づく文書視覚QAモデル、文書理解タスク向けにファインチューニング
Downloads 14
Release Time : 6/22/2023

Model Overview

このモデルはLayoutLMv2基本版をDocVQAタスク向けにファインチューニングしたバージョンで、文書のレイアウトとテキスト内容を理解し、文書に関する質問に答えることができます。

Model Features

マルチモーダル理解能力
テキスト内容と文書レイアウト情報を同時に処理
文書専用最適化
文書視覚QAタスク向けに特別にファインチューニング
エンドツーエンド学習
生の文書画像から直接テキストと視覚的特徴を学習

Model Capabilities

文書理解
視覚QA
テキスト位置特定
レイアウト分析

Use Cases

文書処理
フォーム情報抽出
構造化文書から特定フィールド情報を抽出
文書QAシステム
文書内容に関するユーザーの自然言語質問に回答
企業自動化
請求書処理
請求書のキー情報を自動識別・抽出
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase