Pix2text Table Rec
マイクロソフトTable Transformerを基に開発した表構造認識モデルで、ドキュメント内の表検出と認識タスクに使用
Downloads 1,124
Release Time : 3/29/2024
Model Overview
このモデルはPubTables1MとFinTabNet.cデータセットで学習されたTable Transformerモデルで、ドキュメント内の表構造認識に特化しています。
Model Features
Transformerアーキテクチャ採用
DETRと同じTransformerアーキテクチャを採用し、強力な表構造認識能力を有する
複数データセット学習
PubTables1MとFinTabNet.cデータセットで学習し、認識精度が向上
継続的改善
マイクロソフトのオリジナルモデルを基に継続的に改善
Model Capabilities
表検出
表構造認識
ドキュメント分析
Use Cases
ドキュメント処理
PDF表抽出
PDFドキュメントから自動的に表構造を認識・抽出
表の行列入力を正確に認識可能
財務文書分析
財務諸表など複雑な表を含む文書を処理
財務表内の各種データ関係を認識可能
オフィス自動化
スプレッドシート変換
スキャン文書内の表を編集可能なスプレッドシート形式に変換
元の表構造の完全性を保持
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98