L

Layoutlmv3 Finetuned Docvqa

由am-infoweb開發
基於LayoutLMv3-base微調的文檔問答模型,適用於文檔視覺問答任務
下載量 22
發布時間 : 9/5/2023

模型概述

該模型是基於Microsoft LayoutLMv3架構的文檔理解模型,專門針對文檔視覺問答(DocVQA)任務進行微調,能夠理解文檔佈局和文本內容以回答問題

模型特點

文檔佈局理解
能夠同時處理文本內容和文檔佈局信息
視覺問答能力
針對文檔視覺問答任務進行了專門優化
多模態處理
結合文本和視覺信息進行綜合理解

模型能力

文檔理解
視覺問答
文本位置識別
文檔內容分析

使用案例

文檔處理
表單信息提取
從結構化文檔中提取特定信息並回答問題
合同分析
理解合同文檔內容並回答相關問題
教育
試卷自動批改
分析學生答卷內容並評估答案正確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase