Dinov2 Base ONNX
這是facebook/dinov2-base模型的ONNX格式版本,適用於計算機視覺任務。

D
onnx-community
19
0
Comp SigLIP So400M
Apache-2.0
CoMP-MM-1B是一個支持原生圖像分辨率輸入的視覺基礎模型(VFM),基於SigLIP持續預訓練而成。
多模態融合
C
SliMM-X
33
1
Sam2 Hiera Large.fb R1024 2pt1
Apache-2.0
基於HieraDet圖像編碼器的SAM2模型,專注於高效圖像特徵提取
圖像分割
Transformers

S
timm
31
0
Sam2 Hiera Large.fb R1024
Apache-2.0
基於timm庫的SAM2模型,僅包含HieraDet圖像編碼器部分,適用於圖像特徵提取任務。
圖像分割
Transformers

S
timm
747
0
Dinov2.giant.patch 14.reg 4
Apache-2.0
DINOv2是一個基於視覺變換器(ViT)的圖像特徵提取模型,通過引入寄存器機制提升了特徵提取能力。
D
refiners
17
0
C RADIO
其他
NVIDIA開發的視覺特徵提取模型,用於生成圖像嵌入,支持下游任務如圖像分類。

C
nvidia
398
14
Dinov2 Large
DINOv2是Facebook Research發佈的視覺模型,通過自監督學習提取通用視覺特徵,適用於多種下游任務。

D
Xenova
82
1
Dpt Dinov2 Giant Kitti
Apache-2.0
使用DINOv2作為骨幹網絡的DPT框架,用於深度估計任務。
3D視覺
Transformers

D
facebook
56
0
Dpt Dinov2 Large Kitti
Apache-2.0
該模型採用DINOv2作為骨幹網絡的DPT框架,專注於深度估計任務。
3D視覺
Transformers

D
facebook
26
2
Autotrain Ex And Pt 3122688388
這是一個使用AutoTrain訓練的多類別圖像分類模型,能夠識別多種物體類別。
圖像分類
Transformers

A
Lloviant
17
0
Cvt 13
Apache-2.0
CvT-13是一種結合卷積神經網絡和視覺變換器的混合架構模型,在ImageNet-1k數據集上預訓練完成,適用於圖像分類任務。
圖像分類
Transformers

C
microsoft
21.80k
11
Regnet Y 032
Apache-2.0
基於imagenet-1k訓練的RegNet圖像分類模型,通過神經架構搜索設計的高效網絡結構
圖像分類
Transformers

R
facebook
21
0
Dino Vits16
Apache-2.0
基於DINO方法自監督訓練的視覺Transformer模型,適用於圖像特徵提取
圖像分類
Transformers

D
facebook
47.32k
16
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98