V

Vit Base Patch16 224.dino Mlxim

由mlx-vision開發
基於Vision Transformer架構的圖像分類模型,使用DINO自監督方法在ImageNet-1k數據集上訓練而成。
下載量 43
發布時間 : 4/6/2024

模型概述

該模型是一個視覺Transformer模型,專門用於圖像分類任務。它採用DINO自監督學習方法訓練,僅訓練了骨幹網絡,未訓練分類頭部。

模型特點

自監督學習
使用DINO方法進行自監督訓練,無需大量標註數據
注意力機制可視化
支持生成注意力熱圖,幫助理解模型關注點
特徵提取
可以提取分類頭之前的層特徵,適用於遷移學習

模型能力

圖像分類
特徵提取
注意力可視化

使用案例

計算機視覺
圖像分類
對輸入圖像進行分類識別
視覺特徵提取
提取圖像的高級特徵表示,用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase