L

Layoutlmv3 Finetuned DocLayNet

由Mit1208開發
基於LayoutLMv3架構微調的文檔佈局分析模型,專門用於處理DocLayNet數據集中的文檔元素分類任務。
下載量 226
發布時間 : 3/24/2023

模型概述

該模型是在microsoft/layoutlmv3-base基礎上微調的版本,主要用於文檔圖像中的令牌分類任務,能夠識別和分類文檔中的不同佈局元素。

模型特點

文檔佈局理解
能夠理解文檔的視覺佈局和文本內容,識別文檔中的不同元素區域
多模態處理
同時處理文本內容和視覺佈局信息,實現更準確的文檔分析
高效微調
基於預訓練的LayoutLMv3模型進行微調,在特定任務上表現良好

模型能力

文檔佈局分析
視覺文本分類
文檔元素識別

使用案例

文檔處理
合同分析
自動識別合同文檔中的標題、段落、簽名區域等元素
F1值達到0.6667
學術論文解析
提取論文中的摘要、正文、圖表、參考文獻等部分
數字化辦公
表格識別
從掃描文檔中識別表格區域和內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase