L

Layoutlmv2 Base Uncased Finetuned Docvqa

由madiltalay開發
基於LayoutLMv2架構的文檔視覺問答模型,專為文檔理解任務微調
下載量 14
發布時間 : 6/22/2023

模型概述

該模型是LayoutLMv2基礎版在DocVQA任務上的微調版本,能夠理解文檔佈局和文本內容,回答關於文檔的問題。

模型特點

多模態理解能力
同時處理文本內容和文檔佈局信息
文檔專用優化
針對文檔視覺問答任務進行專門微調
端到端訓練
直接從原始文檔圖像學習文本和視覺特徵

模型能力

文檔理解
視覺問答
文本定位
佈局分析

使用案例

文檔處理
表單信息提取
從結構化文檔中提取特定字段信息
文檔問答系統
回答用戶關於文檔內容的自然語言問題
企業自動化
發票處理
自動識別和提取發票中的關鍵信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase