D

Deformable Detr DocLayNet

由Aryn開發
在DocLayNet數據集上訓練的可變形DETR模型,用於文檔佈局分析中的目標檢測任務,達到57.1的box mAP指標。
下載量 18.50k
發布時間 : 3/19/2024

模型概述

可變形DEtection TRansformer(DETR)模型,專為文檔佈局分析設計,能夠檢測文檔中的各類元素。

模型特點

可變形注意力機制
採用可變形注意力模塊,能夠更高效地處理文檔中的不規則佈局和不同尺寸的元素。
端到端訓練
無需傳統目標檢測中的錨框設計和NMS後處理,實現端到端的訓練和推理。
文檔佈局分析優化
專門針對DocLayNet數據集優化,能夠準確識別文檔中的表格、文本段落、圖片等11類元素。

模型能力

文檔元素檢測
邊界框預測
類別分類

使用案例

文檔處理
文檔佈局分析
自動識別文檔中的各類元素及其位置關係
57.1 box mAP
文檔數字化
幫助將紙質文檔轉換為結構化數字格式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase