S

Structtable InternVL2 1B

U4Rによって開発
InternVL2-1Bを基にしたマルチモーダル表認識モデルで、表画像をLaTeX/HTML/Markdown形式に変換可能
ダウンロード数 1,833
リリース時間 : 10/18/2024

モデル概要

このモデルは視覚的な表画像から構造化データ表現を正確に取得でき、複数の表形式変換や表関連の推論タスクをサポート

モデル特徴

多形式出力
表画像をLaTeX、HTML、Markdownの3つの一般的な形式に変換可能
効率的な推論
最適化により推論速度が大幅に向上
大規模トレーニングデータ
DocGenomeベンチマークと合成データに基づきトレーニングされ、200万以上の高品質な画像-LaTeXペアを含む
分野横断的適用性
156の学問分野にわたる表データをカバーし、幅広い適用性を有する

モデル能力

表画像認識
表構造抽出
LaTeX生成
HTML生成
Markdown生成
表質問応答

使用事例

学術出版
論文表変換
スキャンされた論文の表を編集可能なLaTeX形式に変換
学術執筆の効率向上と手入力エラーの削減
企業アプリケーション
財務諸表処理
財務諸表画像を自動認識し構造化データに変換
財務データのデジタル化プロセスの簡素化
ウェブ開発
ウェブ表再構築
デザイン原稿の表をHTMLコードに変換
フロントエンド開発プロセスの加速
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase