🚀 表格检测模型
本项目包含一个经过微调的表格检测模型,专门用于检测国际财务报告准则(IFRS)PDF文件中的表格。该模型基于表格转换器(Table Transformer)架构,能够从PDF和图像等非结构化文档中提取表格。
🚀 快速开始
本模型基于表格转换器架构,专门用于从IFRS格式的PDF文件中检测表格。以下是使用该模型进行表格检测的基本步骤:
from transformers import DetrForObjectDetection, DetrImageProcessor
from PIL import Image
import torch
image_processor = DetrImageProcessor()
model = TableTransformerForObjectDetection.from_pretrained(
"apkonsta/table-transformer-detection-ifrs",
)
image = Image.open("path/to/your/ifrs_pdf_page.png").convert("RGB")
TD_th = 0.5
encoding = image_processor(image, return_tensors="pt")
with torch.no_grad():
outputs = model(**encoding)
probas = outputs.logits.softmax(-1)[0, :, :-1]
keep = probas.max(-1).values > TD_th
target_sizes = torch.tensor(image.size[::-1]).unsqueeze(0)
postprocessed_outputs = image_processor.post_process(outputs, target_sizes)
bboxes_scaled = postprocessed_outputs[0]["boxes"][keep]
✨ 主要特性
- 基于表格转换器(Table Transformer)架构,专为从非结构化文档(如PDF和图像)中提取表格而设计。
- 针对国际财务报告准则(IFRS)PDF文件进行了微调,能够准确检测其中的表格。
- 可以检测两种类型的表格:常规表格和旋转表格。
📦 安装指南
文档未提及安装步骤,故跳过此章节。
💻 使用示例
基础用法
from transformers import DetrForObjectDetection, DetrImageProcessor
from PIL import Image
import torch
image_processor = DetrImageProcessor()
model = TableTransformerForObjectDetection.from_pretrained(
"apkonsta/table-transformer-detection-ifrs",
)
image = Image.open("path/to/your/ifrs_pdf_page.png").convert("RGB")
TD_th = 0.5
encoding = image_processor(image, return_tensors="pt")
with torch.no_grad():
outputs = model(**encoding)
probas = outputs.logits.softmax(-1)[0, :, :-1]
keep = probas.max(-1).values > TD_th
target_sizes = torch.tensor(image.size[::-1]).unsqueeze(0)
postprocessed_outputs = image_processor.post_process(outputs, target_sizes)
bboxes_scaled = postprocessed_outputs[0]["boxes"][keep]
高级用法
文档未提及高级用法相关代码,故跳过此部分。
📚 详细文档
模型详情
属性 |
详情 |
基础模型 |
microsoft/table-transformer-detection |
库 |
transformers |
训练数据 |
该模型在包含2359个IFRS扫描件的数据集上进行训练,重点是检测无边界的表格。 |
类别 |
该模型经过训练可检测两个类别:0 - 表格(常规表格)和1 - 旋转表格。 |
示例图像

🔧 技术细节
文档未提供超过50字的具体技术说明,故跳过此章节。
📄 许可证
文档未提及许可证信息,故跳过此章节。