F

Florence 2 DocLayNet Fixed

由yifeihu開發
基於DocLayNet數據集微調的Florence-2模型,專用於文檔佈局分析任務,通過類別名稱簡化提升性能
下載量 95
發布時間 : 10/29/2024

模型概述

該模型是Florence-2-large-ft的微調版本,針對文檔佈局分析任務進行了優化,特別處理了文檔中的視覺元素分類和定位問題。

模型特點

類別名稱優化
將原始類別名稱簡化為單標記,提升模型性能7%並加速訓練推理
邊界框質量
生成的邊界框邊緣更清晰,避免了文本截斷和多重框問題
科學論文優化
在科學論文子集上表現優異,mAP50-95達到87%

模型能力

文檔佈局分析
視覺元素檢測
文本區域識別
表格檢測
公式識別

使用案例

學術文檔處理
論文圖表識別
自動識別學術論文中的圖表、公式等元素
在科學論文子集上mAP50-95達87%
文檔數字化
文檔結構解析
分析文檔佈局結構,識別頁眉、頁腳、標題等元素
整體mAP50-95達70%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase