U

Uvdoc

PaddlePaddleによって開発
UVDocは主にテキスト画像に対して幾何変換を行い、画像中の文書の歪み、傾き、透視変形などの問題を修正し、後続のテキスト認識の精度を向上させます。
ダウンロード数 8,072
リリース時間 : 6/6/2025

モデル概要

UVDocは文書画像矯正モデルで、文書画像の幾何変形問題(歪み、傾き、透視変形など)を処理し、後続のテキスト認識プロセスを最適化します。

モデル特徴

幾何変換矯正
文書画像中の歪み、傾き、透視変形問題を自動的に検出して矯正できます。
PaddleOCRとの統合
PaddleOCRとシームレスに統合され、OCR前処理ステップとして認識精度を向上させることができます。
パイプライン処理
PP - StructureV3文書分析パイプラインの前処理モジュールとしてサポートされ、エンドツーエンドのソリューションを提供します。

モデル能力

文書画像矯正
テキスト認識前処理
幾何変形修復

使用事例

文書デジタル化
スキャン文書矯正
スキャナーまたは携帯電話で撮影した歪んだ文書を自動的に矯正します。
CER 0.179(DocUNet基準データセット)
OCR前処理
OCRシステムの前置処理モジュールとして認識精度を向上させます。
構造化文書分析
PP - StructureV3との統合
文書分析パイプラインの前処理ステップとして機能します。
表/数式などの構造化要素の認識精度を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase