F

Florence 2 DocLayNet Fixed

yifeihuによって開発
DocLayNetデータセットでファインチューニングされたFlorence-2モデル、ドキュメントレイアウト分析タスク専用、カテゴリ名の簡略化により性能向上
ダウンロード数 95
リリース時間 : 10/29/2024

モデル概要

このモデルはFlorence-2-large-ftのファインチューン版で、ドキュメントレイアウト分析タスクに最適化されており、特にドキュメント内の視覚要素の分類と位置特定問題を処理します。

モデル特徴

カテゴリ名最適化
元のカテゴリ名を単一タグに簡略化、モデル性能7%向上と訓練推論の高速化を実現
境界ボックス品質
生成される境界ボックスの縁がより鮮明で、テキストの切り捨てや多重ボックス問題を回避
科学論文最適化
科学論文サブセットで優れた性能を発揮、mAP50-95が87%に達する

モデル能力

ドキュメントレイアウト分析
視覚要素検出
テキスト領域認識
表検出
数式認識

使用事例

学術ドキュメント処理
論文図表認識
学術論文内の図表、数式などの要素を自動認識
科学論文サブセットでmAP50-95が87%に達する
ドキュメントデジタル化
ドキュメント構造解析
ドキュメントレイアウト構造を分析し、ヘッダー、フッター、見出しなどの要素を認識
全体mAP50-95が70%に達する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase