A

Aimv2 3B Patch14 336

由apple開發
AIMv2 是一個通過多模態自迴歸目標預訓練的視覺模型系列,在多個多模態理解基準測試中表現優異。
下載量 23
發布時間 : 10/29/2024

模型概述

AIMv2 是一種高效的視覺模型,通過多模態自迴歸目標進行預訓練,在圖像分類、目標檢測等任務中表現出色。

模型特點

多模態自迴歸預訓練
採用多模態自迴歸目標進行預訓練,提升模型理解能力
高性能表現
在多個基準測試中優於CLIP、SigLIP和DINOv2等模型
大規模擴展能力
預訓練方法簡單直接,能有效擴展訓練規模

模型能力

圖像特徵提取
圖像分類
開放詞彙目標檢測
指代表達理解

使用案例

計算機視覺
圖像分類
在ImageNet等數據集上進行高精度圖像分類
ImageNet-1k準確率89.2%
細粒度分類
在特定領域數據集如stanford-cars上進行分類
stanford-cars準確率96.6%
醫學影像
病理圖像分析
在camelyon17等醫學影像數據集上進行分析
camelyon17準確率93.2%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase