D

Document Qa Model

Developed by lakshya-rawat
基于LayoutLMv3-base微调的文档问答模型,能够利用OCR数据理解文档并回答相关问题。
Downloads 54
Release Time : 4/19/2025

Model Overview

该模型经过训练,能够利用OCR数据(通过PaddleOCR)理解文档,并准确回答与文档布局中结构化信息相关的问题。

Model Features

多语言支持
支持英语、西班牙语、法语、德语和意大利语的文档问答。
布局感知
能够理解文档的布局和结构,提高问答准确性。
OCR集成
结合PaddleOCR提取的文本和位置信息,增强文档理解能力。

Model Capabilities

文档图像问答
文本信息提取
结构化查询回答

Use Cases

文档处理
水电账单解析
从水电账单图像中提取并回答关于费用、日期等信息。
高准确率的费用和日期信息提取。
发票信息提取
从发票图像中提取供应商、金额和商品信息。
结构化输出供应商和金额信息。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase