L

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

由pierreguillou開發
這是一個文檔理解模型,專門用於分析文檔佈局和內容,在段落級別進行標記分類任務。
下載量 126
發布時間 : 2/15/2023

模型概述

該模型基於LiLT架構,使用DocLayNet基礎數據集在段落級別進行微調,能夠識別文檔中的不同段落類型(如標題、文本、表格等)。

模型特點

多語言支持
模型支持多種語言文檔的理解和分析
段落級別分析
能夠識別文檔中不同段落的功能類型
高精度分類
在測試集上達到86.34%的F1值

模型能力

文檔佈局分析
段落類型識別
多語言文檔處理
標記分類

使用案例

文檔處理
財務報告分析
自動識別財務報告中的不同部分(標題、正文、表格等)
準確率86.34%
科學論文處理
分類科學論文中的公式、圖表和正文內容
公式識別準確率97.33%
法律文檔處理
法律條文解析
識別法律文檔中的章節標題和正文內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase