L

Layoutlmv2 Base Uncased Finetuned Docvqa

由tiennvcs開發
基於LayoutLMv2架構的文檔視覺問答模型,針對文檔理解任務進行了微調
下載量 983
發布時間 : 3/2/2022

模型概述

該模型是基於LayoutLMv2架構的預訓練模型,專門針對文檔視覺問答(DocVQA)任務進行了微調。它能夠理解文檔中的文本內容和佈局信息,回答與文檔內容相關的問題。

模型特點

文檔佈局理解
能夠同時處理文本內容和文檔佈局信息
視覺問答能力
可以回答基於文檔圖像內容的問題
微調優化
針對DocVQA任務進行了專門的微調

模型能力

文檔內容理解
視覺問答
文檔佈局分析

使用案例

文檔處理
表單信息提取
從掃描的表單中提取特定信息
合同分析
回答關於合同條款的具體問題
教育
試卷批改
自動批改掃描的學生試卷
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase