Depth Anything Vitl14
Depth Anything 是一個強大的深度估計模型,利用大規模無標籤數據釋放深度估計的潛力。
下載量 16.70k
發布時間 : 1/23/2024
模型概述
Depth Anything 是一個專注於深度估計的視覺模型,能夠從單張圖像預測場景的深度信息。該模型通過利用大規模無標籤數據,顯著提升了深度估計的準確性和泛化能力。
模型特點
大規模無標籤數據訓練
利用大規模無標籤數據提升模型性能,顯著提高了深度估計的準確性和泛化能力。
高效架構設計
基於ViT-L/14架構優化,在保持高性能的同時實現高效推理。
多尺度處理能力
支持多種分辨率輸入,通過自適應處理保持深度估計的準確性。
模型能力
單圖像深度估計
場景幾何理解
3D場景重建
使用案例
計算機視覺
增強現實
為AR應用提供準確的場景深度信息
提升虛擬對象與現實場景的交互真實感
自動駕駛
輔助自動駕駛系統理解周圍環境
提高障礙物檢測和距離估計的準確性
3D重建
從單張圖像生成3D場景
簡化3D建模流程
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98