T

Testdocumentquestionanswering

Dhineshkによって開発
LayoutLMv2アーキテクチャに基づく文書視覚質問応答モデルで、DocVQAタスク向けにファインチューニングされています
ダウンロード数 16
リリース時間 : 9/27/2023

モデル概要

このモデルはLayoutLMv2基本版のファインチューニングバージョンで、文書視覚質問応答(DocVQA)タスクを処理するために特別に設計されており、文書のレイアウトとテキスト内容の関係を理解できます

モデル特徴

マルチモーダル理解能力
テキスト内容と視覚的レイアウト情報を組み合わせて文書を理解します
文書構造認識
文書内の表、段落などの構造化要素を識別できます
質問応答能力
文書内容に基づいてユーザーの質問に答えます

モデル能力

文書内容理解
視覚的質問応答
文書レイアウト分析
テキストと視覚情報の融合処理

使用事例

文書処理
契約書分析
契約条項に関する質問に自動回答します
表データ抽出
構造化文書から特定情報を抽出します
教育
答案自動採点
学生の答案内容を識別し、回答の正しさを評価します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase