D

Deformable Detr DocLayNet

Arynによって開発
DocLayNetデータセットでトレーニングされた変形可能DETRモデルで、ドキュメントレイアウト分析における物体検出タスクに使用され、57.1のbox mAP指標を達成しました。
ダウンロード数 18.50k
リリース時間 : 3/19/2024

モデル概要

ドキュメントレイアウト分析のために特別に設計された変形可能DEtection TRansformer(DETR)モデルで、ドキュメント内のさまざまな要素を検出できます。

モデル特徴

変形可能なアテンションメカニズム
変形可能なアテンションモジュールを採用しており、ドキュメント内の不規則なレイアウトやさまざまなサイズの要素をより効率的に処理できます。
エンドツーエンドトレーニング
従来の物体検出におけるアンカーボックスの設計やNMS後処理が不要で、エンドツーエンドのトレーニングと推論を実現します。
ドキュメントレイアウト分析の最適化
DocLayNetデータセットに特化して最適化されており、ドキュメント内の表、テキスト段落、画像などの11種類の要素を正確に識別できます。

モデル能力

ドキュメント要素検出
バウンディングボックス予測
カテゴリ分類

使用事例

ドキュメント処理
ドキュメントレイアウト分析
ドキュメント内のさまざまな要素とそれらの位置関係を自動的に識別します
57.1 box mAP
ドキュメントデジタル化
紙のドキュメントを構造化されたデジタル形式に変換するのに役立ちます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase