# 自監督視覺特徵

Dinov2 Small ONNX
DINOv2-small 的 ONNX 格式版本,適用於視覺任務
Transformers
D
onnx-community
14
0
Vit Large Patch14 Dinov2.lvd142m
Apache-2.0
基於視覺Transformer(ViT)的圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練。
圖像分類 Transformers
V
pcuenq
18
0
Dinov2 With Registers Small Imagenet1k 1 Layer
Apache-2.0
基於DINOv2訓練的視覺Transformer模型,通過添加寄存器令牌改進注意力機制,消除偽影並提升性能
圖像分類 Transformers
D
facebook
445
2
Dinov2.giant.patch 14
Apache-2.0
DINOv2 是 Facebook 研究團隊開發的視覺特徵提取模型,通過自監督學習獲得強大的圖像表示能力。
D
refiners
26
0
Dinov2.base.patch 14
Apache-2.0
DINOv2是Facebook Research開發的一種無需監督學習的視覺特徵提取模型,能夠生成魯棒的視覺特徵表示。
D
refiners
18
0
Dinov2.small.patch 14
Apache-2.0
DINOv2是Facebook Research開發的視覺特徵提取模型,無需監督學習即可生成魯棒的視覺特徵。
D
refiners
23
0
Vit Small Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
一種帶有寄存器的視覺Transformer(ViT)圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練。
圖像分類 Transformers
V
timm
15.98k
5
Vit Large Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
帶有寄存器的視覺變換器(ViT)圖像特徵模型,使用自監督的DINOv2方法在LVD-142M數據集上進行預訓練。
圖像分類 Transformers
V
timm
119.48k
7
Vit Giant Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
一個帶有寄存器的視覺Transformer(ViT)圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練。
圖像分類 Transformers
V
timm
917
1
Vit Base Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
一個帶有寄存器的視覺變換器(ViT)圖像特徵模型,使用自監督的DINOv2方法在LVD-142M數據集上進行預訓練。
圖像分類 Transformers
V
timm
40.95k
10
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
基於DINOv2方法訓練的小型視覺Transformer模型,適用於圖像特徵提取和分類任務
圖像分類 Transformers
D
facebook
50.86k
2
Dinov2 Small
Apache-2.0
基於DINOv2方法訓練的小尺寸視覺Transformer模型,通過自監督學習提取圖像特徵
圖像分類 Transformers
D
facebook
5.0M
31
Dinov2 Giant
Apache-2.0
採用DINOv2方法訓練的視覺Transformer模型,通過自監督學習提取圖像特徵
圖像分類 Transformers
D
facebook
117.56k
41
Dinov2 Large
Apache-2.0
基於DINOv2方法訓練的視覺Transformer模型,通過自監督學習從海量圖像數據中提取魯棒視覺特徵
圖像分類 Transformers
D
facebook
558.78k
79
Dinov2 Base
Apache-2.0
基於DINOv2方法訓練的視覺Transformer模型,通過自監督學習提取圖像特徵
圖像分類 Transformers
D
facebook
1.9M
126
Vit Small Patch14 Dinov2.lvd142m
Apache-2.0
基於視覺Transformer(ViT)的圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練
圖像分類 Transformers
V
timm
35.85k
3
Vit Large Patch14 Dinov2.lvd142m
Apache-2.0
基於視覺Transformer(ViT)的自監督圖像特徵模型,採用DINOv2方法在LVD-142M數據集上預訓練,適用於圖像分類和特徵提取任務。
圖像分類 Transformers
V
timm
32.01k
11
Vit Giant Patch14 Dinov2.lvd142m
Apache-2.0
基於視覺Transformer(ViT)的巨型圖像特徵提取模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練
圖像分類 Transformers
V
timm
6,911
0
Vit Base Patch14 Dinov2.lvd142m
Apache-2.0
基於Vision Transformer(ViT)的圖像特徵模型,採用自監督DINOv2方法在LVD-142M數據集上預訓練
圖像分類 Transformers
V
timm
50.71k
4
Vit Large Patch16 224.mae
基於視覺變換器(ViT)的大型圖像特徵提取模型,採用自監督掩碼自編碼器(MAE)方法在ImageNet-1k數據集上預訓練
圖像分類 Transformers
V
timm
960
1
Vit Base Patch16 224.mae
基於視覺Transformer(ViT)的圖像特徵提取模型,採用自監督掩碼自編碼器(MAE)方法在ImageNet-1k數據集上預訓練
圖像分類 Transformers
V
timm
23.63k
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase