F

Florence 2 Large TableDetection

Developed by ucsahin
Florence-2モデルを微調整したマルチモーダルな表検出モデルで、画像内の表領域を正確に位置特定できます。
Downloads 1,993
Release Time : 6/24/2024

Model Overview

これはマルチモーダル言語モデルで、与えられたテキストプロンプトに基づいて画像内の表を検出するタスクに対して微調整されています。このモデルは画像とテキスト入力の組み合わせを利用して、提供された画像内の表の周囲のバウンディングボックスを予測します。

Model Features

マルチモーダル入力
画像とテキスト入力を同時に処理し、より正確な表検出を実現します。
高精度検出
専用に微調整されており、画像内の表領域を正確に識別できます。
エンドツーエンドソリューション
入力画像から出力バウンディングボックスまでの完全なソリューションです。

Model Capabilities

画像内の表検出
バウンディングボックス予測
マルチモーダル処理

Use Cases

文書処理
PDF表抽出
スキャンされたPDF文書から自動的に表を検出して抽出します。
表の位置を正確に識別し、後続のデータ抽出を容易にします。
データ抽出
表データのデジタル化
紙の文書内の表をデジタル形式に変換します。
データ入力の効率を向上させ、手動操作を減らします。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase