L

Lilt Document QA

由TusharGoel開發
LiLT是一個基於文檔視覺問答(DocVQA)任務的預訓練模型,專門用於處理英文文檔中的問答任務。
下載量 80
發布時間 : 10/15/2023

模型概述

LiLT模型通過結合文本和佈局信息,能夠理解文檔結構並回答相關問題,特別適用於表單、發票等結構化文檔的問答場景。

模型特點

多模態理解
同時處理文本內容和文檔佈局信息,增強對結構化文檔的理解能力
文檔結構感知
通過邊界框信息捕捉文檔元素的空間關係
英文文檔優化
專門針對英文文檔問答任務進行微調

模型能力

文檔問答
結構化信息提取
表單理解

使用案例

文檔處理
表單信息提取
從結構化表單中提取特定字段信息
可準確識別表單中的關鍵信息如許可證編號、日期等
發票處理
回答關於發票內容的特定問題
可定位發票中的金額、供應商等信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase