D

Dpt Hybrid Midas

由Intel開發
基於視覺變換器(ViT)的單目深度估計模型,在140萬張圖像上訓練
下載量 224.05k
發布時間 : 12/6/2022

模型概述

密集預測變換器(DPT)模型,用於單目深度估計任務。該模型使用ViT-hybrid作為主幹網絡,能夠從單張圖像預測深度信息。

模型特點

零樣本遷移能力
模型具備優秀的零樣本遷移能力,可在未見過的數據集上表現良好
混合架構
使用ViT-hybrid作為主幹網絡,結合了卷積和變換器的優勢
大規模訓練
在約140萬張圖像的MIX-6數據集上訓練,具有強大的泛化能力

模型能力

單目深度估計
零樣本遷移
圖像深度預測

使用案例

計算機視覺
場景深度分析
從單張圖像估計場景中各物體的相對深度
可生成與輸入圖像對應的深度圖
3D場景重建
為3D重建提供深度信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase