L

Layoutlmv3 Base Mpdocvqa

由rubentito開發
該模型是基於微軟LayoutLMv3預訓練模型,在多頁文檔問答(MP-DocVQA)數據集上微調的文檔視覺問答模型。
下載量 664
發布時間 : 2/21/2023

模型概述

該模型專門用於文檔視覺問答任務,能夠處理多頁文檔中的問答需求,結合文本和視覺信息進行答案預測。

模型特點

多模態處理能力
結合文本和視覺信息進行文檔理解,適用於複雜的文檔視覺問答任務。
多頁文檔支持
能夠處理多頁文檔中的問答需求,預測答案所在頁面。
高效性能
在125M參數規模下實現較好的文檔問答性能。

模型能力

文檔視覺問答
多頁文檔處理
文本和視覺信息融合

使用案例

文檔處理
合同文檔問答
從多頁合同文檔中提取特定條款信息
ANLS 0.4538, APPA 51.9426
報告文檔分析
分析多頁報告文檔中的關鍵數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase