F

Florence 2 Large Ft

由andito開發
Florence-2是微軟開發的先進視覺基礎模型,採用基於提示的方法處理各類視覺與視覺-語言任務。
下載量 93
發布時間 : 6/21/2024

模型概述

Florence-2通過簡單文本提示即可執行圖像描述、目標檢測和分割等任務,依託FLD-5B大規模數據集實現多任務學習。

模型特點

統一視覺表徵
通過單一模型處理多種視覺任務,減少專用模型需求
提示驅動
通過簡單文本提示切換不同任務模式
大規模預訓練
基於FLD-5B數據集(1.26億圖像,54億標註)訓練

模型能力

圖像描述生成
目標檢測
圖像分割
文字識別
視覺問答
指代表達理解

使用案例

內容理解
自動圖像標註
為圖像生成詳細描述
在COCO描述測試集上CIDEr得分143.3
視覺分析
目標檢測
識別圖像中的物體及其位置
COCO檢測驗證mAP 37.5(零樣本)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase