F

Florence 2 Large Ft

由microsoft開發
Florence-2是微軟開發的先進視覺基礎模型,採用基於提示的方法處理廣泛的視覺與視覺-語言任務。
下載量 269.44k
發布時間 : 6/15/2024

模型概述

Florence-2是一種先進的視覺基礎模型,能通過簡單文本提示執行圖像描述、目標檢測和分割等任務。依託包含1.26億張圖像、54億標註的FLD-5B數據集,Florence-2實現了多任務學習的突破。

模型特點

多任務學習能力
通過單一模型處理多種視覺任務,包括圖像描述、目標檢測和分割等。
基於提示的任務執行
通過簡單文本提示即可執行不同視覺任務,無需特定任務模型。
大規模預訓練
基於包含1.26億張圖像和54億標註的FLD-5B數據集進行預訓練。

模型能力

圖像描述生成
目標檢測
圖像分割
文字識別
視覺問答
密集區域描述
區域提議

使用案例

計算機視覺
圖像自動標註
為圖像生成詳細描述,可用於內容管理和檢索系統。
在COCO描述測試集上CIDEr得分143.3
智能監控
即時檢測和識別監控視頻中的對象和行為。
在COCO檢測驗證集上mAP達到37.5
內容理解
社交媒體內容分析
自動分析社交媒體圖片內容,提取關鍵信息。
在Flickr30k測試集上R@1達到84.4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase