A

Aimv2 3B Patch14 224

由apple開發
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多項基準測試中表現優異
下載量 57
發布時間 : 10/29/2024

模型概述

AIMv2是一個強大的視覺模型,通過多模態自迴歸目標進行預訓練,在圖像分類和理解任務中表現出色

模型特點

多模態自迴歸預訓練
採用創新的多模態自迴歸目標進行預訓練,提高模型理解能力
卓越的分類性能
在ImageNet等多項基準測試中達到頂尖準確率
大規模參數
3B參數的強大模型,能夠捕捉更豐富的視覺特徵

模型能力

圖像特徵提取
圖像分類
多模態理解
開放詞彙目標檢測
指代表達理解

使用案例

計算機視覺
通用圖像分類
在ImageNet等標準數據集上進行圖像分類
ImageNet-1k準確率88.5%
細粒度分類
在stanford-cars等細粒度分類任務中的應用
stanford-cars準確率96.5%
醫學圖像分析
在camelyon17等醫學圖像數據集上的應用
camelyon17準確率93.5%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase