PP-OCRv4_mobile_seal_det开源模型 - 高效实现移动端印章文本检测，专为终端优化

首页

PP OCRv4 Mobile Seal Det

由 PaddlePaddle 开发

高效移动端印章文本检测模型，专为终端设备优化

文字识别支持多种语言开源协议:Apache-2.0 #移动端印章检测 #高效文本识别 #文档处理优化

下载量 149

发布时间 : 6/6/2025

模型简介

该模型能够快速、准确地从图像中检测出印章文本，为文档处理、图像识别等场景提供支持

模型特点

高效移动端部署

专为移动端设备优化，具有更高的运行效率

高精度检测

Hmean指标达到96.47%，在印章文本检测任务中表现优异

轻量化设计

适合在终端设备上部署，资源占用低

模型能力

印章文本检测

文档图像处理

印章区域定位

使用案例

文档处理

合同比对

自动检测合同中的印章位置和内容

提高合同审核效率

发票审核

识别发票上的印章信息

自动化报销流程

图像识别

印章验证

检测文档中印章的真实性

防止伪造印章

🚀 PP-OCRv4_mobile_seal_det

PP-OCRv4移动端印章文本检测模型具有更高的效率，适合在终端设备上部署。该模型能够快速、准确地从图像中检测出印章文本，为文档处理、图像识别等场景提供有力支持。

🚀 快速开始

📦 安装指南

1. 安装PaddlePaddle

请参考以下命令，使用pip安装PaddlePaddle：

# 适用于CUDA11.8
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

# 适用于CUDA12.6
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

# 适用于CPU
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

PaddlePaddle安装详情请参考PaddlePaddle官方网站。

2. 安装PaddleOCR

从PyPI安装最新版本的PaddleOCR推理包：

python -m pip install paddleocr

💻 使用示例

基础用法

你可以使用以下单命令快速体验模型功能：

paddleocr seal_text_detection \
    --model_name PP-OCRv4_mobile_seal_det \
    -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png

你也可以将印章文本检测模块的模型推理集成到你的项目中。在运行以下代码之前，请将示例图像下载到本地。

from paddleocr import SealTextDetection
model = SealTextDetection(model_name="PP-OCRv4_mobile_seal_det")
output = model.predict(input="k02u35x60XZmaL9hzeQ0T.png", batch_size=1)
for res in output:
    res.print()
    res.save_to_img(save_path="./output/")
    res.save_to_json(save_path="./output/res.json")

运行后，得到的结果如下：

{'res': {'input_path': '/root/.paddlex/predict_input/k02u35x60XZmaL9hzeQ0T.png', 'page_index': None, 'dt_polys': [array([[463, 477],
       ...,
       [428, 505]]), array([[297, 444],
       ...,
       [230, 443]]), array([[457, 346],
       ...,
       [267, 345]]), array([[325,  38],
       ...,
       [322,  37]])], 'dt_scores': [0.9912813174046151, 0.9906722305163783, 0.9847175812219835, 0.9914792941713804]}}

可视化图像如下： image/jpeg

使用命令和参数说明详情请参考文档。

高级用法

单个模型的能力有限，但由多个模型组成的管道可以提供更强的能力，以解决现实场景中的难题。

印章文本识别管道

印章文本识别是一种从文档或图像中自动提取和识别印章内容的技术。印章文本识别是文档处理的一部分，在合同比对、仓库出入库审核、发票报销审核等各种场景中都有广泛应用。该管道包含5个模块：

印章文本检测模块
文本识别模块
布局检测模块（可选）
文档图像方向分类模块（可选）
文本图像矫正模块（可选）

运行以下单命令，快速体验OCR管道：

paddleocr seal_recognition -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png \
    --seal_text_detection_model_name PP-OCRv4_mobile_seal_det \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --save_path ./output \
    --device gpu:0

结果将打印到终端：

{'res': {'input_path': '/root/.paddlex/predict_input/k02u35x60XZmaL9hzeQ0T.png', 'model_settings': {'use_doc_preprocessor': True, 'use_layout_detection': True}, 'doc_preprocessor_res': {'input_path': None, 'page_index': None, 'model_settings': {'use_doc_orientation_classify': False, 'use_doc_unwarping': False}, 'angle': -1}, 'layout_det_res': {'input_path': None, 'page_index': None, 'boxes': [{'cls_id': 16, 'label': 'seal', 'score': 0.9755404591560364, 'coordinate': [6.19458, 0.17910767, 634.38385, 628.8424]}]}, 'seal_res_list': [{'input_path': None, 'page_index': None, 'model_settings': {'use_doc_preprocessor': False, 'use_textline_orientation': False}, 'dt_polys': [array([[320,  39],
       ...,
       [317,  38]]), array([[456, 348],
       ...,
       [299, 346]]), array([[436, 445],
       ...,
       [188, 443]]), array([[159, 470],
       ...,
       [154, 468]])], 'text_det_params': {'limit_side_len': 736, 'limit_type': 'min', 'thresh': 0.2, 'max_side_limit': 4000, 'box_thresh': 0.6, 'unclip_ratio': 0.5}, 'text_type': 'seal', 'textline_orientation_angles': array([-1, ..., -1]), 'text_rec_score_thresh': 0, 'rec_texts': ['天津君和缘商贸有限公司', '发票专用章', '吗繁物', '5263647368706'], 'rec_scores': array([0.99007857, ..., 0.99880081]), 'rec_polys': [array([[320,  39],
       ...,
       [317,  38]]), array([[456, 348],
       ...,
       [299, 346]]), array([[436, 445],
       ...,
       [188, 443]]), array([[159, 470],
       ...,
       [154, 468]])], 'rec_boxes': array([], dtype=float64)}]}}

如果指定了save_path，可视化结果将保存到save_path目录下。可视化输出如下： image/jpeg

命令行方法适用于快速体验。对于项目集成，也只需要几行代码：

from paddleocr import PaddleOCR  

ocr = PaddleOCR(
    seal_text_detection_model_name="PP-OCRv4_mobile_seal_det",
    use_doc_orientation_classify=False, # 使用use_doc_orientation_classify启用/禁用文档方向分类模型
    use_doc_unwarping=False, # 使用use_doc_unwarping启用/禁用文档矫正模块
    device="gpu:0", # 使用device指定GPU进行模型推理
)
result = ocr.predict("https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png")  
for res in result:  
    res.print()  
    res.save_to_img("output")  
    res.save_to_json("output")

管道中默认使用的模型是PP-OCRv4_server_seal_det，因此需要通过参数seal_text_detection_model_name指定为PP-OCRv4_mobile_seal_det。你也可以通过参数seal_text_detection_model_dir使用本地模型文件。使用命令和参数说明详情请参考文档。