D

Detr Layout Detection

由cmarkea開發
基於DETR架構的文檔佈局檢測模型,能夠識別文檔中的多種佈局元素。
下載量 13.21k
發布時間 : 7/29/2024

模型概述

該模型基於detr-resnet-50模型在DocLayNet數據集上進行微調,可同時預測文檔對象的掩碼和邊界框,是處理待導入開放域問答系統(ODQA)文檔語料的理想選擇。

模型特點

多類別檢測
可識別11類文檔實體,包括標題、腳註、公式、列表項等
雙任務輸出
同時預測文檔對象的掩碼和邊界框
高性能
在DocLayNet評估數據集上表現出色,F1分數達91.27

模型能力

文檔佈局分析
目標檢測
語義分割

使用案例

文檔處理
開放域問答系統預處理
為ODQA系統準備文檔語料,識別不同佈局元素
有效分離文檔中的文本、圖片、表格等元素
文檔數字化
將掃描文檔轉換為結構化數字格式
準確識別各類文檔元素及其位置關係
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase