U

Uvdoc

由 PaddlePaddle 开发
UVDoc主要用于对文本图像进行几何变换,以纠正图像中文档的扭曲、倾斜、透视变形等问题,从而提高后续文本识别的准确性。
下载量 8,072
发布时间 : 6/6/2025

模型简介

UVDoc是一个文档图像矫正模型,能够处理文档图像的几何变形问题,如扭曲、倾斜和透视变形,优化后续的文本识别流程。

模型特点

几何变换矫正
能够自动检测并矫正文档图像中的扭曲、倾斜和透视变形问题。
集成PaddleOCR
与PaddleOCR无缝集成,可作为OCR预处理步骤提升识别准确率。
管道化处理
支持作为PP-StructureV3文档分析管道的预处理模块,提供端到端解决方案。

模型能力

文档图像矫正
文本识别预处理
几何变形修复

使用案例

文档数字化
扫描文档矫正
对扫描仪或手机拍摄的扭曲文档进行自动矫正
CER 0.179(DocUNet基准数据集)
OCR预处理
作为OCR系统的前置处理模块提升识别准确率
结构化文档分析
PP-StructureV3集成
作为文档分析管道的预处理步骤
提升表格/公式等结构化元素的识别精度
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase