🚀 表格檢測模型
本項目包含一個經過微調的表格檢測模型,專門用於檢測國際財務報告準則(IFRS)PDF文件中的表格。該模型基於表格轉換器(Table Transformer)架構,能夠從PDF和圖像等非結構化文檔中提取表格。
🚀 快速開始
本模型基於表格轉換器架構,專門用於從IFRS格式的PDF文件中檢測表格。以下是使用該模型進行表格檢測的基本步驟:
from transformers import DetrForObjectDetection, DetrImageProcessor
from PIL import Image
import torch
image_processor = DetrImageProcessor()
model = TableTransformerForObjectDetection.from_pretrained(
"apkonsta/table-transformer-detection-ifrs",
)
image = Image.open("path/to/your/ifrs_pdf_page.png").convert("RGB")
TD_th = 0.5
encoding = image_processor(image, return_tensors="pt")
with torch.no_grad():
outputs = model(**encoding)
probas = outputs.logits.softmax(-1)[0, :, :-1]
keep = probas.max(-1).values > TD_th
target_sizes = torch.tensor(image.size[::-1]).unsqueeze(0)
postprocessed_outputs = image_processor.post_process(outputs, target_sizes)
bboxes_scaled = postprocessed_outputs[0]["boxes"][keep]
✨ 主要特性
- 基於表格轉換器(Table Transformer)架構,專為從非結構化文檔(如PDF和圖像)中提取表格而設計。
- 針對國際財務報告準則(IFRS)PDF文件進行了微調,能夠準確檢測其中的表格。
- 可以檢測兩種類型的表格:常規表格和旋轉表格。
📦 安裝指南
文檔未提及安裝步驟,故跳過此章節。
💻 使用示例
基礎用法
from transformers import DetrForObjectDetection, DetrImageProcessor
from PIL import Image
import torch
image_processor = DetrImageProcessor()
model = TableTransformerForObjectDetection.from_pretrained(
"apkonsta/table-transformer-detection-ifrs",
)
image = Image.open("path/to/your/ifrs_pdf_page.png").convert("RGB")
TD_th = 0.5
encoding = image_processor(image, return_tensors="pt")
with torch.no_grad():
outputs = model(**encoding)
probas = outputs.logits.softmax(-1)[0, :, :-1]
keep = probas.max(-1).values > TD_th
target_sizes = torch.tensor(image.size[::-1]).unsqueeze(0)
postprocessed_outputs = image_processor.post_process(outputs, target_sizes)
bboxes_scaled = postprocessed_outputs[0]["boxes"][keep]
高級用法
文檔未提及高級用法相關代碼,故跳過此部分。
📚 詳細文檔
模型詳情
屬性 |
詳情 |
基礎模型 |
microsoft/table-transformer-detection |
庫 |
transformers |
訓練數據 |
該模型在包含2359個IFRS掃描件的數據集上進行訓練,重點是檢測無邊界的表格。 |
類別 |
該模型經過訓練可檢測兩個類別:0 - 表格(常規表格)和1 - 旋轉表格。 |
示例圖像

🔧 技術細節
文檔未提供超過50字的具體技術說明,故跳過此章節。
📄 許可證
文檔未提及許可證信息,故跳過此章節。