T

TF ID Base

yifeihuによって開発
TF-IDは学術論文から表や図表およびそのキャプションを抽出するための物体検出モデルシリーズです。
ダウンロード数 408
リリース時間 : 7/10/2024

モデル概要

TF-IDはFlorence-2をファインチューニングした物体検出モデルで、学術論文内の表や図表を認識し、バウンディングボックスとキャプションテキストの抽出をサポートします。

モデル特徴

高精度な表・図表検出
テストセットで97.29%の正解率を達成
キャプションテキスト認識
表・図表とそのキャプションテキストのバウンディングボックスを同時検出可能
複数バージョン選択
基本版と大規模モデル版、キャプション認識有無の異なるバージョンを提供
人手によるアノテーションデータ
訓練データはHugging Face Daily Papersから取得し、全てのバウンディングボックスは人手でアノテーションと検証済み

モデル能力

表検出
図表検出
キャプションテキスト認識
学術論文分析

使用事例

学術研究
論文内容分析
論文内の表や図表情報を自動抽出
文献検索・分析効率の向上
知識グラフ構築
学術知識グラフ向けの構造化データソースを提供
学術情報の検索性向上
出版業界
学術誌レイアウト支援
論文内の図表位置を自動認識
出版プロセスの簡素化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase