L

Layoutlmv2 Base Uncased Finetuned Docvqa V2

由MariaK開發
該模型是基於microsoft/layoutlmv2-base-uncased在文檔視覺問答任務上微調的版本,專注於處理文檔圖像中的文本和佈局信息。
下載量 54
發布時間 : 2/9/2023

模型概述

LayoutLMv2模型通過結合文本、佈局和視覺信息,專門用於文檔理解任務。該微調版本針對文檔視覺問答(DocVQA)任務進行了優化。

模型特點

多模態理解
同時處理文檔中的文本內容、空間佈局和視覺特徵
文檔問答能力
針對文檔圖像中的問題提供準確的文本回答
佈局感知
理解文檔中文本的空間排列關係,增強語義理解

模型能力

文檔圖像理解
視覺問答
文本佈局分析
多模態信息處理

使用案例

文檔處理
表單信息提取
從掃描的表單文檔中提取特定字段信息
合同分析
回答關於合同文檔內容的特定問題
教育
試卷自動批改
分析學生答卷並回答評分相關問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase