🚀 PP-LCNet_x1_0_table_cls
PP-LCNet_x1_0_table_clsは、表分類モジュールの重要なモデルです。入力された表画像を分類することができ、その性能は、表認識プロセス全体の精度と効率に直接影響します。
🚀 クイックスタート
以下の手順で、PP-LCNet_x1_0_table_clsモデルの機能をすぐに体験できます。
モデルの使用
paddleocr table_classification \
-i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/6rfhb-CXOHowonjpBsaUJ.png
パイプラインの使用
汎用表認識V2パイプライン
paddleocr table_recognition_v2 -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mabagznApI1k9R8qFoTLc.png \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--save_path ./output \
--device gpu:0
PP-StructureV3
paddleocr pp_structurev3 -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mG4tnwfrvECoFMu-S9mxo.png \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--use_textline_orientation False \
--device gpu:0
✨ 主な機能
表分類モジュールは、コンピュータビジョンシステムの重要なコンポーネントで、入力された表画像を分類する役割を担います。このモジュールは通常、表画像を入力として受け取り、ディープラーニングアルゴリズムを使用して、画像の特徴と内容に基づいて、予め定義されたカテゴリ(有線表や無線表など)に分類します。表分類モジュールの分類結果は、表認識パイプラインに出力されます。主要な指標は以下の通りです。
モデル |
Top1精度(%) |
GPU推論時間 (ms) [通常モード / 高性能モード] |
CPU推論時間 (ms) [通常モード / 高性能モード] |
モデル保存サイズ (M) |
PP-LCNet_x1_0_table_cls |
94.2 |
2.35 / 0.47 |
4.03 / 1.35 |
6.6M |
📦 インストール
1. PaddlePaddle
以下のコマンドを参考に、pipを使用してPaddlePaddleをインストールしてください。
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
PaddlePaddleのインストールに関する詳細情報は、PaddlePaddle公式サイトを参照してください。
2. PaddleOCR
PyPIから最新バージョンのPaddleOCR推論パッケージをインストールします。
python -m pip install paddleocr
💻 使用例
基本的な使用法
from paddleocr import TableClassification
model = TableClassification(model_name="PP-LCNet_x1_0_table_cls")
output = model.predict("mabagznApI1k9R8qFoTLc.png", batch_size=1)
for res in output:
res.print(json_format=False)
res.save_to_json("./output/res.json")
res.save_to_img("./output/res.png")
実行後、以下のような結果が得られます。
{'res': {'input_path': 'mabagznApI1k9R8qFoTLc.png', 'page_index': None, 'class_ids': array([1, 0], dtype=int32), 'scores': array([0.79982, 0.20018], dtype=float32), 'label_names': ['wireless_table', 'wired_table']}}
可視化画像は次の通りです。

高度な使用法
汎用表認識V2パイプライン
from paddleocr import TableRecognitionPipelineV2
pipeline = TableRecognitionPipelineV2(
use_doc_orientation_classify=False,
use_doc_unwarping=False,
)
output = pipeline.predict("https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mabagznApI1k9R8qFoTLc.png")
for res in output:
res.print()
res.save_to_img("./output/")
res.save_to_xlsx("./output/")
res.save_to_html("./output/")
res.save_to_json("./output/")
PP-StructureV3
from paddleocr import PPStructureV3
pipeline = PPStructureV3(
use_doc_orientation_classify=False,
use_doc_unwarping=False,
use_textline_orientation=False,
device="gpu:0",
)
output = pipeline.predict("mG4tnwfrvECoFMu-S9mxo.png")
for res in output:
res.print()
res.save_to_json(save_path="output")
res.save_to_markdown(save_path="output")
使用コマンドとパラメータの説明に関する詳細情報は、ドキュメントを参照してください。
📚 ドキュメント
📄 ライセンス
このプロジェクトは、Apache-2.0ライセンスを採用しています。