P

Pix2struct Base Table2html

KennethTMによって開発
Pix2Structベースの表画像からHTMLへの変換モデルで、表画像を構造化されたHTMLコードに変換できます
ダウンロード数 104
リリース時間 : 9/10/2024

モデル概要

このモデルは表画像を受け取り、対応するHTMLコードを出力し、表画像のOCRと構造化認識機能を実現します。画像から表データを抽出する必要がある場面に適しています。

モデル特徴

表画像認識
表画像中の文字と構造を正確に認識できます
HTML生成
認識結果を構造化されたHTMLコードに変換します
複数データセットでの学習
MMTabとPubTabNetの2つのデータセットを使用して学習し、汎化能力を向上させています
1024チャンク長
最大1024のチャンク長をサポートし、複雑な表の処理に適しています

モデル能力

表画像認識
HTMLコード生成
表構造解析
多言語表処理

使用事例

文書デジタル化
PDF表抽出
PDF文書から表を抽出しHTML形式に変換します
編集可能なHTML表コードを生成します
データ収集
ウェブ表スクレイピング
ウェブスクリーンショット中の表を構造化データに変換します
直接使用可能な表データを取得します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase