Distill Any Depth Large Hf
MIT
Distill-Any-Depth是一種新的SOTA單目深度估計模型,採用知識蒸餾算法訓練而成。
3D視覺
Transformers

D
xingyang1
2,322
2
Distill Any Depth Small Hf
MIT
Distill-Any-Depth是一種基於知識蒸餾算法訓練的SOTA單目深度估計模型,能夠高效準確地進行深度估計。
3D視覺
Transformers

D
xingyang1
1,214
3
Depthmaster
Apache-2.0
DepthMaster是一個經過馴化的單步擴散模型,將擴散模型中的生成特徵定製化以適應判別式深度估計任務。
3D視覺 英語
D
zysong212
50
9
Coreml DepthPro
DepthPro 是一種單目深度估計模型,能夠通過單張圖像預測深度。
3D視覺
C
KeighBee
17
4
Depthpro ONNX
DepthPro 是一個用於深度估計的視覺模型,能夠從單張圖像預測場景的深度信息。
3D視覺
Transformers

D
onnx-community
146
10
Marigold E2e Ft Depth
Apache-2.0
一個基於Apache-2.0許可證的單目深度估計模型,適用於野外場景的零樣本深度估計任務。
3D視覺
M
GonzaloMG
1,467
6
Depth
Depth Anything V2是目前最強大的單目深度估計模型,基於59.5萬張合成標註圖像和6200萬+真實無標註圖像訓練而成,具有更精細的細節和更強的魯棒性。
3D視覺
Transformers

D
scenario-labs
75
0
Depth Anything V2 Large Hf
Depth Anything V2是目前最強大的單目深度估計(MDE)模型,基於59.5萬張合成標註圖像和6200萬+真實無標註圖像訓練而成,具有更精細的細節和更強的穩健性。
3D視覺
Transformers

D
depth-anything
83.99k
19
Depth Anything V2 Base Hf
Depth Anything V2 是目前最強大的單目深度估計模型,基於59.5萬張合成標註圖像和6200萬+真實無標註圖像訓練而成,具有更精細的細節和更強的魯棒性。
3D視覺
Transformers

D
depth-anything
47.73k
1
Depth Anything V2 Small Hf
Apache-2.0
Depth Anything V2是目前最強大的單目深度估計模型,基於59.5萬張合成標註圖像和6200萬+真實無標註圖像訓練而成,具有精細細節和魯棒性。
3D視覺
Transformers

D
depth-anything
438.72k
15
Depth Anything V2 Base
Depth-Anything-V2-Base 是一個基於 ONNX 格式的深度估計模型,適配 Transformers.js,用於在 Web 端進行圖像深度估計。
3D視覺
Transformers

D
onnx-community
56
0
Depth Anything V2 Large
Depth Anything V2 是目前最強大的單目深度估計模型,基於大量合成和真實圖像訓練,提供精細的深度細節和高魯棒性。
3D視覺 英語
D
depth-anything
130.54k
94
Depth Anything V2 Base
Depth Anything V2是目前最強大的單目深度估計(MDE)模型,基於59.5萬張合成標註圖像與6200萬+真實無標註圖像訓練而成
3D視覺 英語
D
depth-anything
66.95k
17
Depth Anything V2 Small
Apache-2.0
Depth Anything V2 是目前性能最強的單目深度估計模型,基於大規模合成與真實圖像訓練,相比V1版本能捕捉更精細的細節且更魯棒。
3D視覺 英語
D
depth-anything
55.22k
64
Coreml Depth Anything Small
Apache-2.0
Depth Anything 是一種基於 DPT 架構和 DINOv2 骨幹網絡的深度估計模型,在約 6200 萬張圖像上訓練,在相對和絕對深度估計任務中取得最先進結果。
3D視覺
C
apple
51
36
Zoedepth Nyu Kitti
MIT
ZoeDepth是基於NYU和KITTI數據集微調的深度估計模型,能夠以實際度量單位估計深度值。
3D視覺
Transformers

Z
Intel
20.32k
5
Zoedepth Kitti
MIT
ZoeDepth是一個用於單目深度估計的視覺模型,在KITTI數據集上進行了微調,能夠實現零樣本遷移的度量深度估計。
3D視覺
Transformers

Z
Intel
7,037
2
Zoedepth Nyu
MIT
ZoeDepth是一個用於單目深度估計的模型,特別在NYU數據集上進行了微調,能夠實現零樣本遷移和度量深度估計。
3D視覺
Transformers

Z
Intel
1,279
1
Marigold Depth Lcm V1 0
Apache-2.0
基於潛在一致性蒸餾方法微調的單目深度估計模型,用於從單張圖像生成深度圖
3D視覺 英語
M
prs-eth
22.45k
55
Depth Anything Large Hf
基於Transformers.js的深度估計模型ONNX版本,適用於網頁端應用
3D視覺
Transformers

D
Xenova
19
3
Depth Anything Base Hf
基於Transformers.js的深度估計模型,適配ONNX權重版本,用於從圖像中預測深度信息。
3D視覺
Transformers

D
Xenova
53
0
Depth Anything Small Hf
基於ONNX格式的小型深度估計模型,適配Transformers.js框架,適用於網頁端深度圖預測
3D視覺
Transformers

D
Xenova
4,829
8
Depth Anything Vitl14
Depth Anything 是一個強大的深度估計模型,利用大規模無標籤數據釋放深度估計的潛力。
3D視覺
Transformers

D
LiheYoung
16.70k
42
Depth Anything Vitb14
Depth Anything 是一個基於大規模無標籤數據訓練的深度估計模型,能夠從單張圖像中預測深度信息。
3D視覺
Transformers

D
LiheYoung
7,152
3
Depth Anything Vits14
Depth Anything是一種深度估計模型,利用大規模無標記數據提升性能,適用於單目深度估計任務。
3D視覺
Transformers

D
LiheYoung
8,130
6
Sentis MiDaS
MIT
將 MiDaS 模型轉換為 ONNX 格式,用於在 Unity Sentis 中進行單目深度估計
3D視覺
S
julienkay
31
5
Dpt Swinv2 Large 384
MIT
基於SwinV2骨幹網絡的DPT模型,用於單目深度估計,在140萬張圖像上訓練
3D視覺
Transformers

D
Intel
84
0
Dpt Swinv2 Tiny 256
MIT
基於SwinV2骨幹網絡的DPT模型,用於單目深度估計,在140萬張圖像上訓練。
3D視覺
Transformers

D
Intel
2,285
9
Dpt Swinv2 Base 384
MIT
DPT (密集預測變換器) 模型在140萬張圖像上訓練,用於單目深度估計。該模型使用Swinv2作為骨幹網絡,適用於高精度深度預測任務。
3D視覺
Transformers

D
Intel
182
0
Dpt Beit Base 384
MIT
DPT是基於BEiT骨幹網絡的密集預測變換器模型,用於單目深度估計,在140萬張圖像上訓練。
3D視覺
Transformers

D
Intel
25.98k
1
Dpt Beit Large 384
MIT
基於BEiT骨幹網絡的單目深度估計模型,能夠從單張圖像推斷詳細深度信息
3D視覺
Transformers

D
Intel
135
0
Dpt Hybrid Midas
Apache-2.0
基於視覺變換器(ViT)的單目深度估計模型,在140萬張圖像上訓練
3D視覺
Transformers

D
Intel
224.05k
94
Glpn Nyu
Apache-2.0
GLPN模型在NYUv2數據集上訓練,用於單目深度估計,結合全局和局部路徑網絡實現高精度深度預測。
3D視覺
Transformers

G
vinvino02
7,699
22
Glpn Kitti
Apache-2.0
GLPN是一種用於單目深度估計的模型,採用SegFormer作為主幹網絡,頂部添加輕量級頭部進行深度預測。
3D視覺
Transformers

G
vinvino02
3,401
7
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98