D

Detr Layout Detection

cmarkeaによって開発
DETRアーキテクチャに基づくドキュメントレイアウト検出モデルで、ドキュメント内のさまざまなレイアウト要素を識別できます。
ダウンロード数 13.21k
リリース時間 : 7/29/2024

モデル概要

このモデルは、DocLayNetデータセットでdetr-resnet-50モデルを微調整したもので、ドキュメントオブジェクトのマスクとバウンディングボックスを同時に予測できます。オープンドメイン質問応答システム(ODQA)にインポートするドキュメントコーパスを処理するのに理想的な選択肢です。

モデル特徴

マルチクラス検出
タイトル、脚注、数式、リスト項目など11種類のドキュメントエンティティを識別可能
デュアルタスク出力
ドキュメントオブジェクトのマスクとバウンディングボックスを同時に予測
高性能
DocLayNet評価データセットで優れた性能を発揮し、F1スコアは91.27を達成

モデル能力

ドキュメントレイアウト分析
物体検出
セマンティックセグメンテーション

使用事例

ドキュメント処理
オープンドメインQAシステム前処理
ODQAシステムの準備としてドキュメントコーパスを処理し、異なるレイアウト要素を識別
ドキュメント内のテキスト、画像、表などの要素を効果的に分離
ドキュメントデジタル化
スキャンしたドキュメントを構造化されたデジタル形式に変換
各種ドキュメント要素とその位置関係を正確に識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase