detr-doc-table-detection开源模型 - 免费用于检测文档有框和无框表格

首页

Detr Doc Table Detection

由 TahaDouaji 开发

基于DETR架构的文档表格检测模型，用于检测文档中的有边框和无边框表格

目标检测

Transformers

开源协议:Apache-2.0 #文档表格检测 #无边框表格识别 #端到端目标检测

下载量 233.45k

发布时间 : 3/11/2022

模型简介

该模型是基于facebook/detr-resnet-50训练的文档表格检测模型，专门用于检测文档中的表格区域，支持有边框和无边框表格的检测。

模型特点

端到端目标检测

采用Transformer架构实现端到端的目标检测，无需复杂的后处理

表格检测能力

专门针对文档中的表格进行优化，可检测有边框和无边框表格

基于DETR架构

利用DETR的先进目标检测能力，结合ResNet-50特征提取

模型能力

文档表格检测

有边框表格识别

无边框表格识别

目标检测

使用案例

文档处理

PDF表格提取

从PDF文档中自动检测和提取表格区域

可准确识别文档中的表格位置

文档数字化

帮助将纸质文档中的表格转换为数字化格式

提高文档数字化的效率和准确性

🚀 detr-doc-table-detection 模型卡片

detr-doc-table-detection 是一个用于文档表格检测的模型，能够检测文档中的有边框和无边框表格。它基于 facebook/detr-resnet-50 模型进行训练，为文档表格检测任务提供了有效的解决方案。

🚀 快速开始

使用以下代码开始使用该模型：

from transformers import DetrImageProcessor, DetrForObjectDetection
import torch
from PIL import Image
import requests

image = Image.open("IMAGE_PATH")

processor = DetrImageProcessor.from_pretrained("TahaDouaji/detr-doc-table-detection")
model = DetrForObjectDetection.from_pretrained("TahaDouaji/detr-doc-table-detection")

inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)

# convert outputs (bounding boxes and class logits) to COCO API
# let's only keep detections with score > 0.9
target_sizes = torch.tensor([image.size[::-1]])
results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.9)[0]

for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
    box = [round(i, 2) for i in box.tolist()]
    print(
            f"Detected {model.config.id2label[label.item()]} with confidence "
            f"{round(score.item(), 3)} at location {box}"
    )

✨ 主要特性

能够检测文档中的有边框和无边框表格。
基于 facebook/detr-resnet-50 模型训练。

📚 详细文档

模型详情

开发者：Taha Douaji
共享者：Taha Douaji
模型类型：目标检测
语言：待补充更多信息
许可证：Apache-2.0
基础模型：facebook/detr-resnet-50
更多信息资源：
- 模型演示空间
- 相关论文

使用方式

直接使用

该模型可用于目标检测任务。

非预期使用

该模型不应被用于故意为人们创造敌对或排斥性的环境。

偏差、风险和局限性

大量研究已经探讨了语言模型的偏差和公平性问题（例如，参见 Sheng et al. (2021) 和 Bender et al. (2021)）。该模型生成的预测可能包含针对受保护类别、身份特征以及敏感、社会和职业群体的令人不安和有害的刻板印象。

建议

用户（包括直接用户和下游用户）应该了解该模型的风险、偏差和局限性。如需进一步建议，待补充更多信息。

训练详情

训练数据

该模型在 ICDAR2019 表格数据集上进行训练。

环境影响

可以使用 Lacoste et al. (2019) 中提出的机器学习影响计算器来估算碳排放。

引用

BibTeX：

@article{DBLP:journals/corr/abs-2005-12872,
  author    = {Nicolas Carion and
               Francisco Massa and
               Gabriel Synnaeve and
               Nicolas Usunier and
               Alexander Kirillov and
               Sergey Zagoruyko},
  title     = {End-to-End Object Detection with Transformers},
  journal   = {CoRR},
  volume    = {abs/2005.12872},
  year      = {2020},
  url       = {https://arxiv.org/abs/2005.12872},
  archivePrefix = {arXiv},
  eprint    = {2005.12872},
  timestamp = {Thu, 28 May 2020 17:38:09 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-2005-12872.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}