detr-doc-table-detection開源模型 - 免費用於檢測文檔有框和無框表格

首頁

Detr Doc Table Detection

由TahaDouaji開發

基於DETR架構的文檔表格檢測模型，用於檢測文檔中的有邊框和無邊框表格

目標檢測

Transformers

開源協議:Apache-2.0 #文檔表格檢測 #無邊框表格識別 #端到端目標檢測

下載量 233.45k

發布時間 : 3/11/2022

模型概述

該模型是基於facebook/detr-resnet-50訓練的文檔表格檢測模型，專門用於檢測文檔中的表格區域，支持有邊框和無邊框表格的檢測。

模型特點

端到端目標檢測

採用Transformer架構實現端到端的目標檢測，無需複雜的後處理

表格檢測能力

專門針對文檔中的表格進行優化，可檢測有邊框和無邊框表格

基於DETR架構

利用DETR的先進目標檢測能力，結合ResNet-50特徵提取

模型能力

文檔表格檢測

有邊框表格識別

無邊框表格識別

目標檢測

使用案例

文檔處理

PDF表格提取

從PDF文檔中自動檢測和提取表格區域

可準確識別文檔中的表格位置

文檔數字化

幫助將紙質文檔中的表格轉換為數字化格式

提高文檔數字化的效率和準確性

🚀 detr-doc-table-detection 模型卡片

detr-doc-table-detection 是一個用於文檔表格檢測的模型，能夠檢測文檔中的有邊框和無邊框表格。它基於 facebook/detr-resnet-50 模型進行訓練，為文檔表格檢測任務提供了有效的解決方案。

🚀 快速開始

使用以下代碼開始使用該模型：

from transformers import DetrImageProcessor, DetrForObjectDetection
import torch
from PIL import Image
import requests

image = Image.open("IMAGE_PATH")

processor = DetrImageProcessor.from_pretrained("TahaDouaji/detr-doc-table-detection")
model = DetrForObjectDetection.from_pretrained("TahaDouaji/detr-doc-table-detection")

inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)

# convert outputs (bounding boxes and class logits) to COCO API
# let's only keep detections with score > 0.9
target_sizes = torch.tensor([image.size[::-1]])
results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.9)[0]

for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
    box = [round(i, 2) for i in box.tolist()]
    print(
            f"Detected {model.config.id2label[label.item()]} with confidence "
            f"{round(score.item(), 3)} at location {box}"
    )

✨ 主要特性

能夠檢測文檔中的有邊框和無邊框表格。
基於 facebook/detr-resnet-50 模型訓練。

📚 詳細文檔

模型詳情

開發者：Taha Douaji
共享者：Taha Douaji
模型類型：目標檢測
語言：待補充更多信息
許可證：Apache-2.0
基礎模型：facebook/detr-resnet-50
更多信息資源：
- 模型演示空間
- 相關論文

使用方式

直接使用

該模型可用於目標檢測任務。

非預期使用

該模型不應被用於故意為人們創造敵對或排斥性的環境。

偏差、風險和侷限性

大量研究已經探討了語言模型的偏差和公平性問題（例如，參見 Sheng et al. (2021) 和 Bender et al. (2021)）。該模型生成的預測可能包含針對受保護類別、身份特徵以及敏感、社會和職業群體的令人不安和有害的刻板印象。

建議

用戶（包括直接用戶和下游用戶）應該瞭解該模型的風險、偏差和侷限性。如需進一步建議，待補充更多信息。

訓練詳情

訓練數據

該模型在 ICDAR2019 表格數據集上進行訓練。

環境影響

可以使用 Lacoste et al. (2019) 中提出的機器學習影響計算器來估算碳排放。

引用

BibTeX：

@article{DBLP:journals/corr/abs-2005-12872,
  author    = {Nicolas Carion and
               Francisco Massa and
               Gabriel Synnaeve and
               Nicolas Usunier and
               Alexander Kirillov and
               Sergey Zagoruyko},
  title     = {End-to-End Object Detection with Transformers},
  journal   = {CoRR},
  volume    = {abs/2005.12872},
  year      = {2020},
  url       = {https://arxiv.org/abs/2005.12872},
  archivePrefix = {arXiv},
  eprint    = {2005.12872},
  timestamp = {Thu, 28 May 2020 17:38:09 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-2005-12872.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}