L

Layoutlmv2 Large Uncased Finetuned Infovqa

由tiennvcs開發
基於LayoutLMv2架構的文檔理解模型,針對InfoVQA任務進行微調
下載量 16
發布時間 : 3/2/2022

模型概述

該模型是基於LayoutLMv2架構的文檔理解模型,專門針對信息視覺問答(InfoVQA)任務進行了微調。能夠處理包含文本和佈局信息的文檔,回答與文檔內容相關的問題。

模型特點

多模態理解
能夠同時處理文本內容和視覺佈局信息
文檔問答
專門針對文檔信息問答任務進行優化
大規模預訓練
基於大型LayoutLMv2模型微調,具有強大的文檔理解能力

模型能力

文檔理解
視覺問答
文本佈局分析
信息提取

使用案例

文檔處理
表單信息提取
從結構化文檔中提取特定信息並回答問題
文檔內容問答
根據文檔內容回答用戶提出的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase