T

Tatr Tab Struct V2

deepdoctectionによって開発
PubTables1MとFinTabNetデータセットで訓練されたDETRアーキテクチャモデルで、表構造認識タスク専用
ダウンロード数 99
リリース時間 : 9/4/2023

モデル概要

このモデルはTransformerアーキテクチャを採用し、表内の行、列、ヘッダーおよびセル跨ぎ構造を認識可能で、文書デジタル化処理シナリオに適しています

モデル特徴

セル跨ぎ認識
表内の結合セルや行/列跨ぎ構造を正確に認識可能
多要素検出
表、行、列、ヘッダーなど複数のレイアウト要素を同時検出
境界処理最適化
最適な認識効果を得るため5ピクセルの余白充填を推奨

モデル能力

表領域検出
行列入れ子構造認識
ヘッダー分類
結合セル検出

使用事例

文書デジタル化
財務諸表解析
複雑な財務諸表の構造化データを自動認識
行列入れ子関係及びセル跨ぎデータを正確に抽出
学術文献処理
学術論文からデータ表内容を抽出
元の表の階層関係を維持
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase