PP-OCRv4_server_seal_det開源模型 - 服務器部署精準解決印章文本檢測難題

首頁

PP OCRv4 Server Seal Det

由PaddlePaddle開發

PP-OCRv4的服務器端印章文本檢測模型，具有高準確性，適用於服務器部署，能有效解決印章文本檢測難題。

文字識別支持多種語言開源協議:Apache-2.0 #高精度印章檢測 #服務器級部署 #文檔處理專用

下載量 1,013

發布時間 : 6/5/2025

模型概述

該模型是PaddleOCR系列中的服務器端印章文本檢測模型，專注於從文檔或圖像中檢測印章文本，為文檔處理等場景提供支持。

模型特點

高準確性

關鍵精度指標Hmean達到98.21%，在圓形印章圖像檢測中表現優異。

服務器端部署

專為配置較好的服務器設計，適合高性能需求場景。

靈活集成

支持通過命令行快速體驗或集成到項目中，使用方式多樣。

管道能力

可與其他模塊組成管道，解決複雜現實場景問題。

模型能力

印章文本檢測

文檔處理

圖像分析

使用案例

文檔處理

合同比對

自動檢測合同中的印章文本，用於合同比對和驗證。

提高合同處理的準確性和效率。

發票報銷審核

識別發票上的印章內容，輔助財務審核流程。

簡化報銷流程，減少人工審核時間。

倉庫出入庫審核

檢測出入庫單據中的印章信息，確保單據真實性。

提升倉庫管理的自動化水平。

🚀 PP-OCRv4_server_seal_det

PP-OCRv4的服務器端印章文本檢測模型具有更高的準確性，適用於部署在配置較好的服務器上。該模型可有效解決印章文本檢測難題，為文檔處理等場景提供準確的印章文本識別支持。

🚀 快速開始

📦 安裝指南

1. 安裝PaddlePaddle

請參考以下命令，使用pip安裝PaddlePaddle：

# 適用於CUDA11.8
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

# 適用於CUDA12.6
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

# 適用於CPU
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

PaddlePaddle安裝的詳細信息，請參考PaddlePaddle官方網站。

2. 安裝PaddleOCR

從PyPI安裝最新版本的PaddleOCR推理包：

python -m pip install paddleocr

💻 使用示例

基礎用法

你可以通過一條命令快速體驗該功能：

paddleocr seal_text_detection \
    --model_name PP-OCRv4_server_seal_det \
    -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png

你也可以將印章文本檢測模塊的模型推理集成到你的項目中。在運行以下代碼之前，請將示例圖像下載到本地。

from paddleocr import SealTextDetection
model = SealTextDetection(model_name="PP-OCRv4_server_seal_det")
output = model.predict(input="k02u35x60XZmaL9hzeQ0T.png", batch_size=1)
for res in output:
    res.print()
    res.save_to_img(save_path="./output/")
    res.save_to_json(save_path="./output/res.json")

運行後，得到的結果如下：

{'res': {'input_path': 'k02u35x60XZmaL9hzeQ0T.png', 'page_index': None, 'dt_polys': [array([[165, 469],
       ...,
       [161, 466]]), array([[444, 444],
       ...,
       [441, 443]]), array([[466, 346],
       ...,
       [462, 345]]), array([[324,  38],
       ...,
       [320,  37]])], 'dt_scores': [0.989991263358307, 0.9934761181445114, 0.9916670610495292, 0.9857514344934838]}}

可視化後的圖像如下： image/jpeg

使用命令和參數說明的詳細信息，請參考文檔。

高級用法

單個模型的能力是有限的，但由多個模型組成的管道可以提供更強的能力，以解決現實場景中的難題。

印章文本識別管道

印章文本識別是一種從文檔或圖像中自動提取和識別印章內容的技術。印章文本識別是文檔處理的一部分，在各種場景中有許多應用，如合同比對、倉庫出入庫審核和發票報銷審核。該管道包含5個模塊：

印章文本檢測模塊
文本識別模塊
佈局檢測模塊（可選）
文檔圖像方向分類模塊（可選）
文本圖像矯正模塊（可選）

運行以下命令，快速體驗OCR管道：

paddleocr seal_recognition -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png \
    --seal_text_detection_model_name PP-OCRv4_server_seal_det \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --save_path ./output \
    --device gpu:0

結果會打印到終端：

{'res': {'input_path': '/root/.paddlex/predict_input/k02u35x60XZmaL9hzeQ0T.png', 'model_settings': {'use_doc_preprocessor': True, 'use_layout_detection': True}, 'doc_preprocessor_res': {'input_path': None, 'page_index': None, 'model_settings': {'use_doc_orientation_classify': False, 'use_doc_unwarping': False}, 'angle': -1}, 'layout_det_res': {'input_path': None, 'page_index': None, 'boxes': [{'cls_id': 16, 'label': 'seal', 'score': 0.9755404591560364, 'coordinate': [6.19458, 0.17910767, 634.38385, 628.8424]}]}, 'seal_res_list': [{'input_path': None, 'page_index': None, 'model_settings': {'use_doc_preprocessor': False, 'use_textline_orientation': False}, 'dt_polys': [array([[320,  38],
       ...,
       [315,  38]]), array([[461, 347],
       ...,
       [456, 346]]), array([[439, 445],
       ...,
       [434, 444]]), array([[158, 468],
       ...,
       [154, 466]])], 'text_det_params': {'limit_side_len': 736, 'limit_type': 'min', 'thresh': 0.2, 'max_side_limit': 4000, 'box_thresh': 0.6, 'unclip_ratio': 0.5}, 'text_type': 'seal', 'textline_orientation_angles': array([-1, ..., -1]), 'text_rec_score_thresh': 0, 'rec_texts': ['天津君和緣商貿有限公司', '發票專用章', '嗎繁物', '5263647368706'], 'rec_scores': array([0.99340463, ..., 0.9916274 ]), 'rec_polys': [array([[320,  38],
       ...,
       [315,  38]]), array([[461, 347],
       ...,
       [456, 346]]), array([[439, 445],
       ...,
       [434, 444]]), array([[158, 468],
       ...,
       [154, 466]])], 'rec_boxes': array([], dtype=float64)}]}}

如果指定了save_path，可視化結果將保存在save_path下。可視化輸出如下： image/jpeg

命令行方法適用於快速體驗。對於項目集成，也只需要幾行代碼：

from paddleocr import PaddleOCR  

ocr = PaddleOCR(
    seal_text_detection_model_name="PP-OCRv4_server_seal_det",
    use_doc_orientation_classify=False, # 使用use_doc_orientation_classify啟用/禁用文檔方向分類模型
    use_doc_unwarping=False, # 使用use_doc_unwarping啟用/禁用文檔矯正模塊
    device="gpu:0", # 使用device指定GPU進行模型推理
)
result = ocr.predict("https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png")  
for res in result:  
    res.print()  
    res.save_to_img("output")  
    res.save_to_json("output")