A

Aimv2 1B Patch14 448

由apple開發
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
下載量 71
發布時間 : 10/29/2024

模型概述

AIMv2 是一個高效的視覺模型,通過多模態自迴歸目標進行預訓練,在圖像分類、目標檢測等任務中表現出色。

模型特點

多模態自迴歸預訓練
採用多模態自迴歸目標進行預訓練,提高了模型的泛化能力和性能。
高性能
在多個視覺理解基準測試中表現優於 CLIP 和 SigLIP 等模型。
高效擴展
預訓練方法簡單直接,能夠高效擴展到更大規模的模型。

模型能力

圖像特徵提取
圖像分類
多模態理解

使用案例

計算機視覺
圖像分類
在 ImageNet-1k 等數據集上進行圖像分類任務。
準確率 89.0%
開放詞彙目標檢測
在開放詞彙目標檢測任務中表現優於 DINOv2。
指代表達理解
在指代表達理解任務中表現優於 DINOv2。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase