A

Aimv2 Huge Patch14 336

由apple開發
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
下載量 188
發布時間 : 10/29/2024

模型概述

AIMv2 是一種高效的視覺模型,採用多模態自迴歸目標預訓練方法,適用於圖像分類和特徵提取任務。

模型特點

多模態自迴歸預訓練
採用創新的多模態自迴歸目標進行預訓練,提升模型性能。
卓越的基準測試表現
在多個視覺理解基準測試中優於 CLIP 和 SigLIP 等模型。
強大的識別性能
在 ImageNet 等數據集上達到高準確率。

模型能力

圖像分類
圖像特徵提取
多模態理解

使用案例

計算機視覺
圖像分類
對圖像進行分類,支持多種數據集。
在 ImageNet-1k 上達到 88.2% 準確率
細粒度分類
對特定領域的圖像進行細粒度分類。
在 Stanford Cars 上達到 96.4% 準確率
醫療影像
病理圖像分析
用於醫療影像的分類和分析。
在 Camelyon17 上達到 93.3% 準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase