A

Aimv2 Large Patch14 Native Image Classification

由amaye15開發
AIMv2-Large-Patch14-Native 是一個適配後的圖像分類模型,基於原始AIMv2模型修改,兼容Hugging Face Transformers的AutoModelForImageClassification類。
下載量 15
發布時間 : 11/25/2024

模型概述

本模型是原始AIMv2模型的適配版本,經過修改可與Hugging Face Transformers的AutoModelForImageClassification類兼容,用於圖像分類任務。

模型特點

多模態自迴歸預訓練
AIMv2模型通過多模態自迴歸目標進行預訓練,在各種基準測試中展現出卓越性能。
兼容Hugging Face Transformers
經過適配後,該模型可直接與AutoModelForImageClassification配合使用,便於集成到現有工作流中。
高性能
AIMv2系列在多數多模態理解基準測試中超越OAI CLIP和SigLIP,在開放詞彙目標檢測和指代表達理解任務上優於DINOv2。

模型能力

圖像分類
視覺理解

使用案例

計算機視覺
通用圖像分類
對輸入圖像進行分類,識別其中的主要對象或場景。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase