P

Pix2text Table Rec

breezedeusによって開発
マイクロソフトTable Transformerを基に開発した表構造認識モデルで、ドキュメント内の表検出と認識タスクに使用
ダウンロード数 1,124
リリース時間 : 3/29/2024

モデル概要

このモデルはPubTables1MとFinTabNet.cデータセットで学習されたTable Transformerモデルで、ドキュメント内の表構造認識に特化しています。

モデル特徴

Transformerアーキテクチャ採用
DETRと同じTransformerアーキテクチャを採用し、強力な表構造認識能力を有する
複数データセット学習
PubTables1MとFinTabNet.cデータセットで学習し、認識精度が向上
継続的改善
マイクロソフトのオリジナルモデルを基に継続的に改善

モデル能力

表検出
表構造認識
ドキュメント分析

使用事例

ドキュメント処理
PDF表抽出
PDFドキュメントから自動的に表構造を認識・抽出
表の行列入力を正確に認識可能
財務文書分析
財務諸表など複雑な表を含む文書を処理
財務表内の各種データ関係を認識可能
オフィス自動化
スプレッドシート変換
スキャン文書内の表を編集可能なスプレッドシート形式に変換
元の表構造の完全性を保持
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase