D

Document Qa Model

由lakshya-rawat開發
基於LayoutLMv3-base微調的文檔問答模型,能夠利用OCR數據理解文檔並回答相關問題。
下載量 54
發布時間 : 4/19/2025

模型概述

該模型經過訓練,能夠利用OCR數據(通過PaddleOCR)理解文檔,並準確回答與文檔佈局中結構化信息相關的問題。

模型特點

多語言支持
支持英語、西班牙語、法語、德語和意大利語的文檔問答。
佈局感知
能夠理解文檔的佈局和結構,提高問答準確性。
OCR集成
結合PaddleOCR提取的文本和位置信息,增強文檔理解能力。

模型能力

文檔圖像問答
文本信息提取
結構化查詢回答

使用案例

文檔處理
水電賬單解析
從水電賬單圖像中提取並回答關於費用、日期等信息。
高準確率的費用和日期信息提取。
發票信息提取
從發票圖像中提取供應商、金額和商品信息。
結構化輸出供應商和金額信息。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase