P

PP DocLayout L

PaddlePaddleによって開発
PP-DocLayout-Lは高精度の文書レイアウト領域定位モデルで、RT-DETR-Lアーキテクチャに基づいており、23種類の一般的な文書レイアウトクラスの検出をサポートします。
ダウンロード数 285
リリース時間 : 6/6/2025

モデル概要

このモデルは文書レイアウト検出に特化しており、文書内の様々な要素(テキスト、表、画像など)を正確に位置特定し、文書処理に構造化情報を提供します。

モデル特徴

高精度レイアウト検出
独自のデータセットで学習し、mAP(0.5)が90.4%に達し、文書内の様々なレイアウト要素を正確に識別できます。
多クラスサポート
23種類の一般的な文書レイアウトクラス(テキスト、表、画像、ヘッダー・フッターなど)の検出をサポートします。
広範な文書タイプに適用可能
論文、雑誌、契約書、書籍、試験用紙、研究報告などの様々な文書タイプに適用できます。

モデル能力

文書レイアウト検出
表識別
テキスト領域定位
画像領域検出

使用事例

文書処理
学術論文分析
論文内のタイトル、本文、参考文献などの構造要素を自動識別します。
論文内容の自動分類と構造化を実現します。
契約書解析
契約書文書内の重要条項と署名領域を検出します。
契約書審査の効率を向上させます。
オフィス自動化
文書デジタル化
スキャン文書を構造化されたデジタル形式に変換します。
後続の内容検索と処理を容易にします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase