F

Florence 2 Large Ft

Developed by andito
Florence-2是微軟開發的先進視覺基礎模型,採用基於提示的方法處理各類視覺與視覺-語言任務。
Downloads 93
Release Time : 6/21/2024

Model Overview

Florence-2通過簡單文本提示即可執行圖像描述、目標檢測和分割等任務,依託FLD-5B大規模數據集實現多任務學習。

Model Features

統一視覺表徵
通過單一模型處理多種視覺任務,減少專用模型需求
提示驅動
通過簡單文本提示切換不同任務模式
大規模預訓練
基於FLD-5B數據集(1.26億圖像,54億標註)訓練

Model Capabilities

圖像描述生成
目標檢測
圖像分割
文字識別
視覺問答
指代表達理解

Use Cases

內容理解
自動圖像標註
為圖像生成詳細描述
在COCO描述測試集上CIDEr得分143.3
視覺分析
目標檢測
識別圖像中的物體及其位置
COCO檢測驗證mAP 37.5(零樣本)
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase