🚀 PP-LCNet_x1_0_table_cls
PP-LCNet_x1_0_table_cls是表格分類模塊的重要模型,可對輸入的表格圖像進行分類,其性能直接影響整個表格識別流程的準確性和效率。
🚀 快速開始
你可以通過以下步驟快速體驗PP-LCNet_x1_0_table_cls模型的功能:
模型使用
paddleocr table_classification \
-i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/6rfhb-CXOHowonjpBsaUJ.png
管道使用
通用表格識別V2管道
paddleocr table_recognition_v2 -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mabagznApI1k9R8qFoTLc.png \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--save_path ./output \
--device gpu:0
PP-StructureV3
paddleocr pp_structurev3 -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mG4tnwfrvECoFMu-S9mxo.png \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--use_textline_orientation False \
--device gpu:0
✨ 主要特性
表格分類模塊是計算機視覺系統中的關鍵組件,負責對輸入的表格圖像進行分類。該模塊通常接收表格圖像作為輸入,並使用深度學習算法根據圖像的特徵和內容將其分類為預定義的類別,如有線表格和無線表格。表格分類模塊的分類結果作為輸出,用於表格識別管道。關鍵指標如下:
模型 |
Top1準確率(%) |
GPU推理時間 (ms) [常規模式 / 高性能模式] |
CPU推理時間 (ms) [常規模式 / 高性能模式] |
模型存儲大小 (M) |
PP-LCNet_x1_0_table_cls |
94.2 |
2.35 / 0.47 |
4.03 / 1.35 |
6.6M |
📦 安裝指南
1. PaddlePaddle
請參考以下命令,使用pip安裝PaddlePaddle:
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
有關PaddlePaddle安裝的詳細信息,請參考PaddlePaddle官方網站。
2. PaddleOCR
從PyPI安裝最新版本的PaddleOCR推理包:
python -m pip install paddleocr
💻 使用示例
基礎用法
from paddleocr import TableClassification
model = TableClassification(model_name="PP-LCNet_x1_0_table_cls")
output = model.predict("mabagznApI1k9R8qFoTLc.png", batch_size=1)
for res in output:
res.print(json_format=False)
res.save_to_json("./output/res.json")
res.save_to_img("./output/res.png")
運行後,得到的結果如下:
{'res': {'input_path': 'mabagznApI1k9R8qFoTLc.png', 'page_index': None, 'class_ids': array([1, 0], dtype=int32), 'scores': array([0.79982, 0.20018], dtype=float32), 'label_names': ['wireless_table', 'wired_table']}}
可視化圖像如下:

高級用法
通用表格識別V2管道
from paddleocr import TableRecognitionPipelineV2
pipeline = TableRecognitionPipelineV2(
use_doc_orientation_classify=False,
use_doc_unwarping=False,
)
output = pipeline.predict("https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mabagznApI1k9R8qFoTLc.png")
for res in output:
res.print()
res.save_to_img("./output/")
res.save_to_xlsx("./output/")
res.save_to_html("./output/")
res.save_to_json("./output/")
PP-StructureV3
from paddleocr import PPStructureV3
pipeline = PPStructureV3(
use_doc_orientation_classify=False,
use_doc_unwarping=False,
use_textline_orientation=False,
device="gpu:0",
)
output = pipeline.predict("mG4tnwfrvECoFMu-S9mxo.png")
for res in output:
res.print()
res.save_to_json(save_path="output")
res.save_to_markdown(save_path="output")
有關使用命令和參數說明的詳細信息,請參考文檔。
📚 詳細文檔
📄 許可證
本項目採用Apache-2.0許可證。