L

Layout Xlm Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

由pierreguillou開發
該模型是基於LayoutXLM基礎模型在DocLayNet數據集上微調的版本,專門用於文檔佈局分析和段落級內容理解。
下載量 79
發布時間 : 3/25/2023

模型概述

這是一個多語言文檔理解模型,能夠識別和分析PDF文檔中的段落級別元素,如標題、文本、表格、圖片等。

模型特點

段落級文檔理解
能夠識別和分析文檔中的段落級別元素,包括標題、文本、表格、圖片等11種不同類型
多語言支持
支持英語、德語、法語和日語等多種語言的文檔分析
高準確率
在DocLayNet測試集上取得了86.55%的段落準確率和96.93%的標記準確率

模型能力

文檔佈局分析
段落分類
多語言文檔處理
PDF內容理解

使用案例

金融文檔處理
財務報告分析
自動識別財務報告中的不同部分,如表格、文本和標題
準確率高達90%以上
法律文檔處理
法律條文解析
識別法律文檔中的章節、條款和註釋
章節標題識別準確率83.16%
科學文獻處理
科學論文解析
識別論文中的公式和圖表
公式識別準確率95.33%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase