V

Vit Giant Patch14 Reg4 Dinov2.lvd142m

Developed by timm
一個帶有寄存器的視覺Transformer(ViT)圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練。
Downloads 917
Release Time : 10/30/2023

Model Overview

該模型主要用於圖像分類和特徵提取任務,基於視覺Transformer架構,通過自監督學習在大型數據集上進行預訓練。

Model Features

寄存器增強
模型採用了寄存器技術,增強了視覺Transformer的性能和穩定性。
自監督學習
使用DINOv2自監督學習方法在LVD-142M數據集上進行預訓練。
大規模預訓練
在LVD-142M大規模數據集上預訓練,具有強大的特徵提取能力。

Model Capabilities

圖像特徵提取
圖像分類
視覺表示學習

Use Cases

計算機視覺
圖像分類
可用於對圖像進行分類,支持多種類別識別。
在多個基準數據集上表現出色
特徵提取
可作為特徵提取器用於下游視覺任務。
提取的特徵可用於目標檢測、圖像分割等任務
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase