Dinov2 With Registers Base
D

Dinov2 With Registers Base

由facebook開發
基於DINOv2訓練的視覺Transformer模型,通過添加寄存器標記優化注意力機制,提升特徵提取能力
下載量 22.74k
發布時間 : 12/20/2024

模型概述

該模型是帶有寄存器的視覺Transformer(ViT)基礎版,採用DINOv2方法進行自監督訓練,能夠從圖像中提取高質量的特徵表示,適用於各種計算機視覺任務。

模型特點

寄存器機制
通過添加專用寄存器標記消除注意力圖譜偽影,獲得更清晰的注意力分佈
自監督學習
採用DINOv2方法進行訓練,無需標註數據即可學習有意義的圖像特徵表示
注意力優化
改進的注意力機制提供更可解釋的注意力圖譜,有助於理解模型決策過程

模型能力

圖像特徵提取
自監督學習
計算機視覺任務基礎模型

使用案例

計算機視覺
圖像分類
可作為基礎模型,添加分類頭部進行圖像分類任務
目標檢測
提取的圖像特徵可用於目標檢測任務
圖像相似度計算
利用提取的特徵向量計算圖像間的相似度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase