# 視覺特徵提取

Dinov2 Base ONNX
這是facebook/dinov2-base模型的ONNX格式版本,適用於計算機視覺任務。
Transformers
D
onnx-community
19
0
Comp SigLIP So400M
Apache-2.0
CoMP-MM-1B是一個支持原生圖像分辨率輸入的視覺基礎模型(VFM),基於SigLIP持續預訓練而成。
多模態融合
C
SliMM-X
33
1
Sam2 Hiera Large.fb R1024 2pt1
Apache-2.0
基於HieraDet圖像編碼器的SAM2模型,專注於高效圖像特徵提取
圖像分割 Transformers
S
timm
31
0
Sam2 Hiera Large.fb R1024
Apache-2.0
基於timm庫的SAM2模型,僅包含HieraDet圖像編碼器部分,適用於圖像特徵提取任務。
圖像分割 Transformers
S
timm
747
0
Dinov2.giant.patch 14.reg 4
Apache-2.0
DINOv2是一個基於視覺變換器(ViT)的圖像特徵提取模型,通過引入寄存器機制提升了特徵提取能力。
D
refiners
17
0
C RADIO
其他
NVIDIA開發的視覺特徵提取模型,用於生成圖像嵌入,支持下游任務如圖像分類。
Transformers
C
nvidia
398
14
Dinov2 Large
DINOv2是Facebook Research發佈的視覺模型,通過自監督學習提取通用視覺特徵,適用於多種下游任務。
Transformers
D
Xenova
82
1
Dpt Dinov2 Giant Kitti
Apache-2.0
使用DINOv2作為骨幹網絡的DPT框架,用於深度估計任務。
3D視覺 Transformers
D
facebook
56
0
Dpt Dinov2 Large Kitti
Apache-2.0
該模型採用DINOv2作為骨幹網絡的DPT框架,專注於深度估計任務。
3D視覺 Transformers
D
facebook
26
2
Autotrain Ex And Pt 3122688388
這是一個使用AutoTrain訓練的多類別圖像分類模型,能夠識別多種物體類別。
圖像分類 Transformers
A
Lloviant
17
0
Cvt 13
Apache-2.0
CvT-13是一種結合卷積神經網絡和視覺變換器的混合架構模型,在ImageNet-1k數據集上預訓練完成,適用於圖像分類任務。
圖像分類 Transformers
C
microsoft
21.80k
11
Regnet Y 032
Apache-2.0
基於imagenet-1k訓練的RegNet圖像分類模型,通過神經架構搜索設計的高效網絡結構
圖像分類 Transformers
R
facebook
21
0
Dino Vits16
Apache-2.0
基於DINO方法自監督訓練的視覺Transformer模型,適用於圖像特徵提取
圖像分類 Transformers
D
facebook
47.32k
16
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase