T

TFT ID 1.0

yifeihuによって開発
TFT-IDは学術論文における表、図表およびテキスト領域を検出するために特別に調整された物体検出モデルで、Florence-2を基に微調整されています
ダウンロード数 153
リリース時間 : 7/25/2024

モデル概要

このモデルは学術論文ページ内の表、図表およびテキスト領域を認識し、境界ボックス情報を出力します。テキスト領域はOCRプロセスに直接接続可能です

モデル特徴

高精度検出
表・図表認識タスクにおいて98.84%の成功率を達成
複数領域認識
表、図表およびテキスト領域を同時に検出
手動アノテーションデータ
トレーニングデータには36,000以上の手動で注釈付けされ検証されたバウンディングボックスが含まれます
OCR統合
テキスト領域はOCRプロセスに直接接続可能で、TB-OCR-preview-0.1モデルの使用が推奨されます

モデル能力

学術論文画像分析
表検出
図表検出
テキスト領域検出
境界ボックス出力

使用事例

学術研究
論文内容分析
論文内の表、図表およびテキスト領域を自動認識
研究者が論文内の重要な情報を迅速に特定・抽出するのに役立ちます
文献デジタル化
紙またはPDF論文を構造化されたデジタルコンテンツに変換
文献処理効率を向上させ、後の分析と検索を容易にします
出版業界
ジャーナルレイアウトチェック
論文内の図表と表の位置が出版要件に合致しているかを自動検出
手動チェック作業を削減し、出版効率を向上させます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase