PP-LCNet_x1_0_table_clsオープンソースの表分類モデル - 無料でデプロイ可能、有線と無線の表分類をサポート

ホーム

PP LCNet X1 0 Table Cls

PaddlePaddleによって開発

PP-LCNet_x1_0_table_clsは、入力された表画像を分類するための効率的な表分類モデルで、有線表と無線表の分類をサポートしています。

画像分類複数言語対応オープンソースライセンス:Apache-2.0 #表画像分類 #高精度分類 #軽量級モデル

ダウンロード数 1,141

リリース時間 : 6/6/2025

モデル概要

このモデルは表認識プロセスの重要なコンポーネントで、表画像の特徴と内容に基づいて、有線表や無線表などの事前定義されたカテゴリに分類することができます。分類結果は、表認識プロセス全体の精度と効率に直接影響します。

モデル特徴

効率的な推論

モデルはGPUとCPUの両方で効率的な推論速度を示し、実際のアプリケーションシナリオに適しています。

高い正確率

Top1正確率が94.2%に達し、表画像を信頼性高く分類することができます。

軽量化

モデルの保存サイズはわずか6.6Mで、リソースが制限された環境に適しています。

モデル能力

表画像分類

有線表認識

無線表認識

使用事例

文書処理

表認識プロセス

表認識プロセスでは、まずこのモデルを使用して表画像を分類し、その後分類結果に基づいて後続の処理を行います。

表認識の精度と効率を向上させます。

自動化オフィス

表データ抽出

自動化オフィスシナリオでの表データ抽出に使用され、財務報告書や請求書などに適用されます。

表を迅速かつ正確に分類し、後続のデータ抽出を容易にします。

🚀 PP-LCNet_x1_0_table_cls

PP-LCNet_x1_0_table_clsは、表分類モジュールの重要なモデルです。入力された表画像を分類することができ、その性能は、表認識プロセス全体の精度と効率に直接影響します。

🚀 クイックスタート

以下の手順で、PP-LCNet_x1_0_table_clsモデルの機能をすぐに体験できます。

モデルの使用

paddleocr table_classification \
    -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/6rfhb-CXOHowonjpBsaUJ.png

パイプラインの使用

汎用表認識V2パイプライン

paddleocr table_recognition_v2 -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mabagznApI1k9R8qFoTLc.png  \
    --use_doc_orientation_classify False  \
    --use_doc_unwarping False \
    --save_path ./output \
    --device gpu:0

PP-StructureV3

paddleocr pp_structurev3 -i https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mG4tnwfrvECoFMu-S9mxo.png \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False \
    --device gpu:0

✨ 主な機能

表分類モジュールは、コンピュータビジョンシステムの重要なコンポーネントで、入力された表画像を分類する役割を担います。このモジュールは通常、表画像を入力として受け取り、ディープラーニングアルゴリズムを使用して、画像の特徴と内容に基づいて、予め定義されたカテゴリ（有線表や無線表など）に分類します。表分類モジュールの分類結果は、表認識パイプラインに出力されます。主要な指標は以下の通りです。

モデル	Top1精度(%)	GPU推論時間 (ms) [通常モード / 高性能モード]	CPU推論時間 (ms) [通常モード / 高性能モード]	モデル保存サイズ (M)
PP-LCNet_x1_0_table_cls	94.2	2.35 / 0.47	4.03 / 1.35	6.6M

📦 インストール

1. PaddlePaddle

以下のコマンドを参考に、pipを使用してPaddlePaddleをインストールしてください。

# CUDA11.8用
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

# CUDA12.6用
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

# CPU用
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

PaddlePaddleのインストールに関する詳細情報は、PaddlePaddle公式サイトを参照してください。

2. PaddleOCR

PyPIから最新バージョンのPaddleOCR推論パッケージをインストールします。

python -m pip install paddleocr

💻 使用例

基本的な使用法

from paddleocr import TableClassification
model = TableClassification(model_name="PP-LCNet_x1_0_table_cls")
output = model.predict("mabagznApI1k9R8qFoTLc.png", batch_size=1)
for res in output:
    res.print(json_format=False)
    res.save_to_json("./output/res.json")
    res.save_to_img("./output/res.png")

実行後、以下のような結果が得られます。

{'res': {'input_path': 'mabagznApI1k9R8qFoTLc.png', 'page_index': None, 'class_ids': array([1, 0], dtype=int32), 'scores': array([0.79982, 0.20018], dtype=float32), 'label_names': ['wireless_table', 'wired_table']}}

可視化画像は次の通りです。

image/jpeg

高度な使用法

汎用表認識V2パイプライン

from paddleocr import TableRecognitionPipelineV2

pipeline = TableRecognitionPipelineV2(
    use_doc_orientation_classify=False, # use_doc_orientation_classifyを使用して、文書方向分類モデルを有効/無効にする
    use_doc_unwarping=False, # use_doc_unwarpingを使用して、文書矯正モジュールを有効/無効にする
)
output = pipeline.predict("https://cdn-uploads.huggingface.co/production/uploads/681c1ecd9539bdde5ae1733c/mabagznApI1k9R8qFoTLc.png")
for res in output:
    res.print() ## 予測された構造化出力を印刷する
    res.save_to_img("./output/")
    res.save_to_xlsx("./output/")
    res.save_to_html("./output/")
    res.save_to_json("./output/")

PP-StructureV3

from paddleocr import PPStructureV3

pipeline = PPStructureV3(
    use_doc_orientation_classify=False, # use_doc_orientation_classifyを使用して、文書方向分類モデルを有効/無効にする
    use_doc_unwarping=False,    # use_doc_unwarpingを使用して、文書矯正モジュールを有効/無効にする
    use_textline_orientation=False, # use_textline_orientationを使用して、テキスト行方向分類モデルを有効/無効にする
    device="gpu:0", # deviceを使用して、GPUを指定してモデル推論を行う
    )
output = pipeline.predict("mG4tnwfrvECoFMu-S9mxo.png")
for res in output:
    res.print() # 構造化予測出力を印刷する
    res.save_to_json(save_path="output") ## 現在の画像の構造化結果をJSON形式で保存する
    res.save_to_markdown(save_path="output") ## 現在の画像の結果をMarkdown形式で保存する