RADIO
由NVIDIA研发的视觉特征提取模型,可将图像转换为嵌入向量供下游任务使用
图像特征提取
Transformers

R
nvidia
5,166
36
PE Spatial G14 448
Apache-2.0
感知编码器(PE)是通过简单视觉语言学习训练的最先进的图像和视频理解编码器。
图像特征提取
P
facebook
3,256
16
C RADIOv2 B
其他
C-RADIOv2是NVIDIA开发的视觉特征提取模型,提供多种尺寸版本,适用于图像理解和密集视觉任务。
图像特征提取
Transformers

C
nvidia
404
8
Dinov2.giant.patch 14
Apache-2.0
DINOv2 是 Facebook 研究团队开发的视觉特征提取模型,通过自监督学习获得强大的图像表示能力。
图像特征提取
D
refiners
26
0
Openvision Vit Small Patch8 224
Apache-2.0
OpenVision是一个全开放、高性价比的先进视觉编码器家族,专注于多模态学习。
图像特征提取
O
UCSC-VLAA
25
0
Dinov2.small.patch 14
Apache-2.0
DINOv2是Facebook Research开发的视觉特征提取模型,无需监督学习即可生成鲁棒的视觉特征。
图像特征提取
D
refiners
23
0
Dinov2.large.patch 14
Apache-2.0
DINOv2 large是基于自监督学习的大规模视觉特征提取模型,能够生成鲁棒的图像特征表示。
图像特征提取
D
refiners
20
0
Openvision Vit Tiny Patch16 384
Apache-2.0
OpenVision是一个全开放、高性价比的先进视觉编码器家族,专注于多模态学习。
图像特征提取
O
UCSC-VLAA
19
0
Dinov2.base.patch 14
Apache-2.0
DINOv2是Facebook Research开发的一种无需监督学习的视觉特征提取模型,能够生成鲁棒的视觉特征表示。
图像特征提取
D
refiners
18
0
Dinov2.giant.patch 14.reg 4
Apache-2.0
DINOv2是一个基于视觉变换器(ViT)的图像特征提取模型,通过引入寄存器机制提升了特征提取能力。
图像特征提取
D
refiners
17
0
Dinov2.large.patch 14.reg 4
Apache-2.0
DINOv2是一个基于视觉变换器的图像特征提取模型,通过引入寄存器机制提升了特征提取能力。
图像特征提取
D
refiners
15
0