PP-OCRv4_server_seal_det开源模型 - 服务器部署精准解决印章文本检测难题

首页

PP OCRv4 Server Seal Det

由 PaddlePaddle 开发

PP-OCRv4的服务器端印章文本检测模型，具有高准确性，适用于服务器部署，能有效解决印章文本检测难题。

文字识别支持多种语言开源协议:Apache-2.0 #高精度印章检测 #服务器级部署 #文档处理专用

下载量 1,013

发布时间 : 6/5/2025

模型简介

该模型是PaddleOCR系列中的服务器端印章文本检测模型，专注于从文档或图像中检测印章文本，为文档处理等场景提供支持。

模型特点

高准确性

关键精度指标Hmean达到98.21%，在圆形印章图像检测中表现优异。

服务器端部署

专为配置较好的服务器设计，适合高性能需求场景。

灵活集成

支持通过命令行快速体验或集成到项目中，使用方式多样。

管道能力

可与其他模块组成管道，解决复杂现实场景问题。

模型能力

印章文本检测

文档处理

图像分析

使用案例

文档处理

合同比对

自动检测合同中的印章文本，用于合同比对和验证。

提高合同处理的准确性和效率。

发票报销审核

识别发票上的印章内容，辅助财务审核流程。

简化报销流程，减少人工审核时间。

仓库出入库审核

检测出入库单据中的印章信息，确保单据真实性。

提升仓库管理的自动化水平。

🚀 PP-OCRv4_server_seal_det

PP-OCRv4的服务器端印章文本检测模型具有更高的准确性，适用于部署在配置较好的服务器上。该模型可有效解决印章文本检测难题，为文档处理等场景提供准确的印章文本识别支持。

🚀 快速开始

📦 安装指南

1. 安装PaddlePaddle

请参考以下命令，使用pip安装PaddlePaddle：

# 适用于CUDA11.8
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

# 适用于CUDA12.6
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

# 适用于CPU
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

PaddlePaddle安装的详细信息，请参考PaddlePaddle官方网站。

2. 安装PaddleOCR

从PyPI安装最新版本的PaddleOCR推理包：

python -m pip install paddleocr

💻 使用示例

基础用法

你可以通过一条命令快速体验该功能：

paddleocr seal_text_detection \
    --model_name PP-OCRv4_server_seal_det \
    -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png

你也可以将印章文本检测模块的模型推理集成到你的项目中。在运行以下代码之前，请将示例图像下载到本地。

from paddleocr import SealTextDetection
model = SealTextDetection(model_name="PP-OCRv4_server_seal_det")
output = model.predict(input="k02u35x60XZmaL9hzeQ0T.png", batch_size=1)
for res in output:
    res.print()
    res.save_to_img(save_path="./output/")
    res.save_to_json(save_path="./output/res.json")

运行后，得到的结果如下：

{'res': {'input_path': 'k02u35x60XZmaL9hzeQ0T.png', 'page_index': None, 'dt_polys': [array([[165, 469],
       ...,
       [161, 466]]), array([[444, 444],
       ...,
       [441, 443]]), array([[466, 346],
       ...,
       [462, 345]]), array([[324,  38],
       ...,
       [320,  37]])], 'dt_scores': [0.989991263358307, 0.9934761181445114, 0.9916670610495292, 0.9857514344934838]}}

可视化后的图像如下： image/jpeg

使用命令和参数说明的详细信息，请参考文档。

高级用法

单个模型的能力是有限的，但由多个模型组成的管道可以提供更强的能力，以解决现实场景中的难题。

印章文本识别管道

印章文本识别是一种从文档或图像中自动提取和识别印章内容的技术。印章文本识别是文档处理的一部分，在各种场景中有许多应用，如合同比对、仓库出入库审核和发票报销审核。该管道包含5个模块：

印章文本检测模块
文本识别模块
布局检测模块（可选）
文档图像方向分类模块（可选）
文本图像矫正模块（可选）

运行以下命令，快速体验OCR管道：

paddleocr seal_recognition -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png \
    --seal_text_detection_model_name PP-OCRv4_server_seal_det \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --save_path ./output \
    --device gpu:0

结果会打印到终端：

{'res': {'input_path': '/root/.paddlex/predict_input/k02u35x60XZmaL9hzeQ0T.png', 'model_settings': {'use_doc_preprocessor': True, 'use_layout_detection': True}, 'doc_preprocessor_res': {'input_path': None, 'page_index': None, 'model_settings': {'use_doc_orientation_classify': False, 'use_doc_unwarping': False}, 'angle': -1}, 'layout_det_res': {'input_path': None, 'page_index': None, 'boxes': [{'cls_id': 16, 'label': 'seal', 'score': 0.9755404591560364, 'coordinate': [6.19458, 0.17910767, 634.38385, 628.8424]}]}, 'seal_res_list': [{'input_path': None, 'page_index': None, 'model_settings': {'use_doc_preprocessor': False, 'use_textline_orientation': False}, 'dt_polys': [array([[320,  38],
       ...,
       [315,  38]]), array([[461, 347],
       ...,
       [456, 346]]), array([[439, 445],
       ...,
       [434, 444]]), array([[158, 468],
       ...,
       [154, 466]])], 'text_det_params': {'limit_side_len': 736, 'limit_type': 'min', 'thresh': 0.2, 'max_side_limit': 4000, 'box_thresh': 0.6, 'unclip_ratio': 0.5}, 'text_type': 'seal', 'textline_orientation_angles': array([-1, ..., -1]), 'text_rec_score_thresh': 0, 'rec_texts': ['天津君和缘商贸有限公司', '发票专用章', '吗繁物', '5263647368706'], 'rec_scores': array([0.99340463, ..., 0.9916274 ]), 'rec_polys': [array([[320,  38],
       ...,
       [315,  38]]), array([[461, 347],
       ...,
       [456, 346]]), array([[439, 445],
       ...,
       [434, 444]]), array([[158, 468],
       ...,
       [154, 466]])], 'rec_boxes': array([], dtype=float64)}]}}

如果指定了save_path，可视化结果将保存在save_path下。可视化输出如下： image/jpeg

命令行方法适用于快速体验。对于项目集成，也只需要几行代码：

from paddleocr import PaddleOCR  

ocr = PaddleOCR(
    seal_text_detection_model_name="PP-OCRv4_server_seal_det",
    use_doc_orientation_classify=False, # 使用use_doc_orientation_classify启用/禁用文档方向分类模型
    use_doc_unwarping=False, # 使用use_doc_unwarping启用/禁用文档矫正模块
    device="gpu:0", # 使用device指定GPU进行模型推理
)
result = ocr.predict("https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png")  
for res in result:  
    res.print()  
    res.save_to_img("output")  
    res.save_to_json("output")