PP OCRv4 Server Seal Det
PP-OCRv4的服務器端印章文本檢測模型,具有高準確性,適用於服務器部署,能有效解決印章文本檢測難題。
下載量 1,013
發布時間 : 6/5/2025
模型概述
該模型是PaddleOCR系列中的服務器端印章文本檢測模型,專注於從文檔或圖像中檢測印章文本,為文檔處理等場景提供支持。
模型特點
高準確性
關鍵精度指標Hmean達到98.21%,在圓形印章圖像檢測中表現優異。
服務器端部署
專為配置較好的服務器設計,適合高性能需求場景。
靈活集成
支持通過命令行快速體驗或集成到項目中,使用方式多樣。
管道能力
可與其他模塊組成管道,解決複雜現實場景問題。
模型能力
印章文本檢測
文檔處理
圖像分析
使用案例
文檔處理
合同比對
自動檢測合同中的印章文本,用於合同比對和驗證。
提高合同處理的準確性和效率。
發票報銷審核
識別發票上的印章內容,輔助財務審核流程。
簡化報銷流程,減少人工審核時間。
倉庫出入庫審核
檢測出入庫單據中的印章信息,確保單據真實性。
提升倉庫管理的自動化水平。
🚀 PP-OCRv4_server_seal_det
PP-OCRv4的服務器端印章文本檢測模型具有更高的準確性,適用於部署在配置較好的服務器上。該模型可有效解決印章文本檢測難題,為文檔處理等場景提供準確的印章文本識別支持。
🚀 快速開始
📦 安裝指南
1. 安裝PaddlePaddle
請參考以下命令,使用pip安裝PaddlePaddle:
# 適用於CUDA11.8
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
# 適用於CUDA12.6
python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/
# 適用於CPU
python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
PaddlePaddle安裝的詳細信息,請參考PaddlePaddle官方網站。
2. 安裝PaddleOCR
從PyPI安裝最新版本的PaddleOCR推理包:
python -m pip install paddleocr
💻 使用示例
基礎用法
你可以通過一條命令快速體驗該功能:
paddleocr seal_text_detection \
--model_name PP-OCRv4_server_seal_det \
-i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png
你也可以將印章文本檢測模塊的模型推理集成到你的項目中。在運行以下代碼之前,請將示例圖像下載到本地。
from paddleocr import SealTextDetection
model = SealTextDetection(model_name="PP-OCRv4_server_seal_det")
output = model.predict(input="k02u35x60XZmaL9hzeQ0T.png", batch_size=1)
for res in output:
res.print()
res.save_to_img(save_path="./output/")
res.save_to_json(save_path="./output/res.json")
運行後,得到的結果如下:
{'res': {'input_path': 'k02u35x60XZmaL9hzeQ0T.png', 'page_index': None, 'dt_polys': [array([[165, 469],
...,
[161, 466]]), array([[444, 444],
...,
[441, 443]]), array([[466, 346],
...,
[462, 345]]), array([[324, 38],
...,
[320, 37]])], 'dt_scores': [0.989991263358307, 0.9934761181445114, 0.9916670610495292, 0.9857514344934838]}}
可視化後的圖像如下:
使用命令和參數說明的詳細信息,請參考文檔。
高級用法
單個模型的能力是有限的,但由多個模型組成的管道可以提供更強的能力,以解決現實場景中的難題。
印章文本識別管道
印章文本識別是一種從文檔或圖像中自動提取和識別印章內容的技術。印章文本識別是文檔處理的一部分,在各種場景中有許多應用,如合同比對、倉庫出入庫審核和發票報銷審核。該管道包含5個模塊:
- 印章文本檢測模塊
- 文本識別模塊
- 佈局檢測模塊(可選)
- 文檔圖像方向分類模塊(可選)
- 文本圖像矯正模塊(可選)
運行以下命令,快速體驗OCR管道:
paddleocr seal_recognition -i https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png \
--seal_text_detection_model_name PP-OCRv4_server_seal_det \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--save_path ./output \
--device gpu:0
結果會打印到終端:
{'res': {'input_path': '/root/.paddlex/predict_input/k02u35x60XZmaL9hzeQ0T.png', 'model_settings': {'use_doc_preprocessor': True, 'use_layout_detection': True}, 'doc_preprocessor_res': {'input_path': None, 'page_index': None, 'model_settings': {'use_doc_orientation_classify': False, 'use_doc_unwarping': False}, 'angle': -1}, 'layout_det_res': {'input_path': None, 'page_index': None, 'boxes': [{'cls_id': 16, 'label': 'seal', 'score': 0.9755404591560364, 'coordinate': [6.19458, 0.17910767, 634.38385, 628.8424]}]}, 'seal_res_list': [{'input_path': None, 'page_index': None, 'model_settings': {'use_doc_preprocessor': False, 'use_textline_orientation': False}, 'dt_polys': [array([[320, 38],
...,
[315, 38]]), array([[461, 347],
...,
[456, 346]]), array([[439, 445],
...,
[434, 444]]), array([[158, 468],
...,
[154, 466]])], 'text_det_params': {'limit_side_len': 736, 'limit_type': 'min', 'thresh': 0.2, 'max_side_limit': 4000, 'box_thresh': 0.6, 'unclip_ratio': 0.5}, 'text_type': 'seal', 'textline_orientation_angles': array([-1, ..., -1]), 'text_rec_score_thresh': 0, 'rec_texts': ['天津君和緣商貿有限公司', '發票專用章', '嗎繁物', '5263647368706'], 'rec_scores': array([0.99340463, ..., 0.9916274 ]), 'rec_polys': [array([[320, 38],
...,
[315, 38]]), array([[461, 347],
...,
[456, 346]]), array([[439, 445],
...,
[434, 444]]), array([[158, 468],
...,
[154, 466]])], 'rec_boxes': array([], dtype=float64)}]}}
如果指定了save_path
,可視化結果將保存在save_path
下。可視化輸出如下:
命令行方法適用於快速體驗。對於項目集成,也只需要幾行代碼:
from paddleocr import PaddleOCR
ocr = PaddleOCR(
seal_text_detection_model_name="PP-OCRv4_server_seal_det",
use_doc_orientation_classify=False, # 使用use_doc_orientation_classify啟用/禁用文檔方向分類模型
use_doc_unwarping=False, # 使用use_doc_unwarping啟用/禁用文檔矯正模塊
device="gpu:0", # 使用device指定GPU進行模型推理
)
result = ocr.predict("https://cdn-uploads.huggingface.co/production/uploads/63d7b8ee07cd1aa3c49a2026/k02u35x60XZmaL9hzeQ0T.png")
for res in result:
res.print()
res.save_to_img("output")
res.save_to_json("output")
管道中使用的默認模型是PP-OCRv4_server_seal_det
。使用命令和參數說明的詳細信息,請參考文檔。
📚 詳細文檔
屬性 | 詳情 |
---|---|
模型類型 | 服務器端印章文本檢測模型 |
訓練數據 | 文檔未提及 |
✨ 主要特性
PP-OCRv4_server_seal_det模型具有以下特性:
- 準確性高:關鍵精度指標Hmean達到98.21%(基於PaddleX自定義測試數據集,包含500張圓形印章圖像)。
- 適用於服務器部署:適合部署在配置較好的服務器上。
- 支持多種使用方式:既可以通過命令行快速體驗,也可以集成到項目中使用。
- 管道能力強:可與其他模塊組成管道,解決現實場景中的複雜問題。
📄 許可證
本項目採用Apache-2.0許可證。
🔗 相關鏈接
⚠️ 重要提示
上述指標是基於PaddleX自定義測試數據集,包含500張圓形印章圖像。
💡 使用建議
在運行代碼前,請確保已正確安裝PaddlePaddle和PaddleOCR,並將示例圖像下載到本地。
Table Transformer Structure Recognition
MIT
基於PubTables1M數據集訓練的表格變換器模型,用於從非結構化文檔中提取表格結構
文字識別
Transformers

T
microsoft
1.2M
186
Trocr Small Handwritten
TrOCR是一個基於Transformer的光學字符識別模型,專門用於手寫文本圖像的識別。
文字識別
Transformers

T
microsoft
517.96k
45
Table Transformer Structure Recognition V1.1 All
MIT
基於Transformer的表格結構識別模型,用於檢測文檔中的表格結構
文字識別
Transformers

T
microsoft
395.03k
70
Trocr Large Printed
基於Transformer的光學字符識別模型,適用於單行印刷體文本識別
文字識別
Transformers

T
microsoft
295.59k
162
Texify
Texify 是一個 OCR 工具,專門用於將公式圖片和文本轉換為 LaTeX 格式。
文字識別
Transformers

T
vikp
206.53k
15
Trocr Base Printed
TrOCR是基於Transformer的光學字符識別模型,專為單行文本圖像識別設計,採用編碼器-解碼器架構
文字識別
Transformers

T
microsoft
184.84k
169
Manga Ocr Base
Apache-2.0
專為日語文本設計的光學字符識別工具,主要針對日本漫畫場景優化。
文字識別
Transformers 日語

M
kha-white
130.36k
145
Tiny Random Internvl2
專注於將圖像中的文本信息提取並轉化為可編輯的文本內容
文字識別
Safetensors
T
katuni4ka
73.27k
0
Trocr Large Handwritten
TrOCR是基於Transformer的光學字符識別模型,專為手寫文本識別設計,在IAM數據集上進行了微調。
文字識別
Transformers

T
microsoft
59.17k
115
Trocr Small Printed
TrOCR是一個基於Transformer的光學字符識別模型,適用於單行文本圖像的OCR任務。
文字識別
Transformers

T
microsoft
20.88k
40
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98