L

Layoutlmv3 Base Mpdocvqa

Developed by rubentito
该模型是基于微软LayoutLMv3预训练模型,在多页文档问答(MP-DocVQA)数据集上微调的文档视觉问答模型。
Downloads 664
Release Time : 2/21/2023

Model Overview

该模型专门用于文档视觉问答任务,能够处理多页文档中的问答需求,结合文本和视觉信息进行答案预测。

Model Features

多模态处理能力
结合文本和视觉信息进行文档理解,适用于复杂的文档视觉问答任务。
多页文档支持
能够处理多页文档中的问答需求,预测答案所在页面。
高效性能
在125M参数规模下实现较好的文档问答性能。

Model Capabilities

文档视觉问答
多页文档处理
文本和视觉信息融合

Use Cases

文档处理
合同文档问答
从多页合同文档中提取特定条款信息
ANLS 0.4538, APPA 51.9426
报告文档分析
分析多页报告文档中的关键数据
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase