layoutlmv3-finetuned-DocLayNet開源文檔佈局分析模型

Layoutlmv3 Finetuned DocLayNet

由Mit1208開發

基於LayoutLMv3架構微調的文檔佈局分析模型，專門用於處理DocLayNet數據集中的文檔元素分類任務。

下載量 226

發布時間 : 3/24/2023

模型概述

該模型是在microsoft/layoutlmv3-base基礎上微調的版本，主要用於文檔圖像中的令牌分類任務，能夠識別和分類文檔中的不同佈局元素。

文檔佈局理解

能夠理解文檔的視覺佈局和文本內容，識別文檔中的不同元素區域

多模態處理

同時處理文本內容和視覺佈局信息，實現更準確的文檔分析

高效微調

基於預訓練的LayoutLMv3模型進行微調，在特定任務上表現良好

文檔佈局分析

視覺文本分類

文檔元素識別

文檔處理

合同分析

自動識別合同文檔中的標題、段落、簽名區域等元素

F1值達到0.6667

學術論文解析

提取論文中的摘要、正文、圖表、參考文獻等部分

數字化辦公

表格識別

從掃描文檔中識別表格區域和內容