A

Aimv2 Large Patch14 448

由apple開發
AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列,在多個基準測試中表現優異
下載量 2,210
發布時間 : 10/29/2024

模型概述

AIMv2採用多模態自迴歸目標進行預訓練,在圖像分類、目標檢測等視覺任務中展現出強大性能

模型特點

多模態自迴歸預訓練
採用創新的多模態自迴歸目標進行預訓練,提升模型理解能力
卓越性能表現
在多個基準測試中超越CLIP、SigLIP和DINOv2等主流視覺模型
大規模擴展能力
預訓練方法簡單直接,能有效擴展訓練規模

模型能力

圖像特徵提取
圖像分類
多模態理解
開放詞彙目標檢測
指代表達理解

使用案例

計算機視覺
圖像分類
在ImageNet等數據集上進行圖像分類任務
在ImageNet-1k上達到87.9%準確率
細粒度分類
在特定領域的細粒度圖像分類任務
在Stanford Cars上達到96.6%準確率
醫學圖像分析
處理醫學影像分類任務
在Camelyon17上達到94.1%準確率
遙感圖像處理
衛星圖像分類
處理衛星和航拍圖像分類任務
在EuroSAT上達到98.6%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase