A

Aimv2 3B Patch14 448

由apple開發
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
下載量 161
發布時間 : 10/29/2024

模型概述

AIMv2系列視覺模型通過多模態自迴歸目標進行預訓練,具有強大的圖像特徵提取和分類能力,在多個基準測試中優於同類模型。

模型特點

多模態自迴歸預訓練
採用多模態自迴歸目標進行預訓練,有效提升模型性能。
卓越的分類性能
在多個基準測試中優於OpenAI CLIP、SigLIP和DINOv2等模型。
大規模參數
3B參數的模型規模,具備強大的特徵提取能力。

模型能力

圖像特徵提取
圖像分類
多模態理解

使用案例

計算機視覺
圖像分類
在ImageNet等數據集上進行高精度圖像分類。
ImageNet-1k準確率89.5%
細粒度分類
在stanford-cars等細粒度分類任務中表現優異。
stanford-cars準確率96.7%
醫學影像
病理圖像分析
在camelyon17等醫學影像數據集上進行分類。
camelyon17準確率93.4%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase