T

Testdocumentquestionanswering

由Dhineshk開發
基於LayoutLMv2架構的文檔視覺問答模型,針對DocVQA任務進行微調
下載量 16
發布時間 : 9/27/2023

模型概述

該模型是LayoutLMv2基礎版的微調版本,專門用於處理文檔視覺問答(DocVQA)任務,能夠理解文檔佈局和文本內容的關係

模型特點

多模態理解能力
結合文本內容和視覺佈局信息進行文檔理解
文檔結構感知
能夠識別文檔中的表格、段落等結構化元素
問答能力
針對文檔內容回答用戶提出的問題

模型能力

文檔內容理解
視覺問答
文檔佈局分析
文本與視覺信息融合處理

使用案例

文檔處理
合同分析
自動回答關於合同條款內容的問題
表格數據提取
從結構化文檔中提取特定信息
教育
試卷自動批改
識別學生答卷內容並評估答案正確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase