D

Deformable Detr DocLayNet

Developed by Aryn
在DocLayNet数据集上训练的可变形DETR模型,用于文档布局分析中的目标检测任务,达到57.1的box mAP指标。
Downloads 18.50k
Release Time : 3/19/2024

Model Overview

可变形DEtection TRansformer(DETR)模型,专为文档布局分析设计,能够检测文档中的各类元素。

Model Features

可变形注意力机制
采用可变形注意力模块,能够更高效地处理文档中的不规则布局和不同尺寸的元素。
端到端训练
无需传统目标检测中的锚框设计和NMS后处理,实现端到端的训练和推理。
文档布局分析优化
专门针对DocLayNet数据集优化,能够准确识别文档中的表格、文本段落、图片等11类元素。

Model Capabilities

文档元素检测
边界框预测
类别分类

Use Cases

文档处理
文档布局分析
自动识别文档中的各类元素及其位置关系
57.1 box mAP
文档数字化
帮助将纸质文档转换为结构化数字格式
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase