A

Aimv2 Huge Patch14 448

由apple開發
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多個基準測試中表現優異。
下載量 1,672
發布時間 : 10/29/2024

模型概述

AIMv2是一種高效的視覺模型,採用多模態自迴歸目標進行預訓練,在圖像分類、特徵提取等任務中表現出色。

模型特點

多模態自迴歸預訓練
採用創新的多模態自迴歸目標進行預訓練,提高模型性能
卓越的基準測試表現
在多個視覺基準測試中超越CLIP、SigLIP和DINOv2等模型
強大的識別能力
在ImageNet上達到89.5%的準確率,展示出色的識別性能

模型能力

圖像特徵提取
圖像分類
多模態理解
開放詞彙目標檢測
指代表達理解

使用案例

計算機視覺
圖像分類
對圖像進行分類識別
在ImageNet-1k上準確率達88.6%
自然圖像識別
識別自然場景中的物體
在iNaturalist-18上準確率達82.8%
細粒度分類
進行細粒度物體分類
在Stanford Cars上準確率達96.5%
醫療影像
病理圖像分析
分析醫療病理圖像
在Camelyon17上準確率達93.4%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase