V

Vit Giant Patch14 Reg4 Dinov2.lvd142m

由timm開發
一個帶有寄存器的視覺Transformer(ViT)圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練。
下載量 917
發布時間 : 10/30/2023

模型概述

該模型主要用於圖像分類和特徵提取任務,基於視覺Transformer架構,通過自監督學習在大型數據集上進行預訓練。

模型特點

寄存器增強
模型採用了寄存器技術,增強了視覺Transformer的性能和穩定性。
自監督學習
使用DINOv2自監督學習方法在LVD-142M數據集上進行預訓練。
大規模預訓練
在LVD-142M大規模數據集上預訓練,具有強大的特徵提取能力。

模型能力

圖像特徵提取
圖像分類
視覺表示學習

使用案例

計算機視覺
圖像分類
可用於對圖像進行分類,支持多種類別識別。
在多個基準數據集上表現出色
特徵提取
可作為特徵提取器用於下游視覺任務。
提取的特徵可用於目標檢測、圖像分割等任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase