L

Layoutlmv2 Large Uncased Finetuned Vi Infovqa

Developed by tiennvcs
microsoft/layoutlmv2-large-uncasedをベースにファインチューニングしたドキュメント視覚質問応答モデルで、ベトナム語情報抽出タスクに適しています
Downloads 16
Release Time : 3/2/2022

Model Overview

このモデルはドキュメント視覚質問応答(VQA)タスク向けに最適化されたLayoutLMv2モデルで、特にベトナム語情報抽出シナリオに適応し、ドキュメントのレイアウトと視覚情報を理解して質問に答えることができます

Model Features

マルチモーダル理解能力
テキスト、レイアウト、視覚情報を統合的に理解する
ベトナム語最適化
ベトナム語のドキュメント情報抽出タスク向けに特別にファインチューニングされています
ドキュメント構造認識
ドキュメントのレイアウトや構造情報を理解できます

Model Capabilities

ドキュメント視覚質問応答
ベトナム語情報抽出
ドキュメントレイアウト分析
マルチモーダル理解

Use Cases

ドキュメント処理
ベトナム語フォーム情報抽出
ベトナム語のフォームドキュメントから自動的にキー情報を抽出します
ドキュメント視覚質問応答システム
ドキュメント内容に関する自然言語の質問に答えます
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase