D

Dino Vits16

由facebook開發
基於DINO方法自監督訓練的視覺Transformer模型,適用於圖像特徵提取
下載量 47.32k
發布時間 : 3/2/2022

模型概述

該視覺Transformer模型採用自監督方式在ImageNet-1k數據集上預訓練,可提取圖像特徵用於下游任務

模型特點

自監督學習
採用DINO方法進行自監督訓練,無需人工標註數據
圖像塊處理
將圖像分割為16x16像素塊進行處理
通用特徵提取
學習到的圖像表示可遷移到各種下游視覺任務

模型能力

圖像特徵提取
圖像分類基礎模型
視覺表示學習

使用案例

計算機視覺
圖像分類
在預訓練模型基礎上添加分類頭進行微調
目標檢測
作為特徵提取器用於目標檢測任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase