D

Dpt Swinv2 Large 384

由Intel開發
基於SwinV2骨幹網絡的DPT模型,用於單目深度估計,在140萬張圖像上訓練
下載量 84
發布時間 : 12/10/2023

模型概述

該模型是MiDaS 3.1版本中的DPT(密集預測變換器)模型,專門用於從單張圖像估計深度信息。它採用了SwinV2架構作為骨幹網絡,適用於生成式AI、3D重建和自動駕駛等應用場景。

模型特點

基於SwinV2骨幹網絡
採用分層變換器架構,通過移位窗口計算提高效率,適合處理視覺任務
大規模訓練數據
在140萬張圖像上進行訓練,涵蓋多樣化的場景
零樣本遷移能力
支持零樣本深度估計,無需針對特定場景進行微調

模型能力

單目深度估計
零樣本遷移
圖像深度分析

使用案例

計算機視覺
3D場景重建
從單張圖像生成深度信息,用於3D場景建模
可生成詳細的深度圖
自動駕駛
為自動駕駛系統提供環境深度感知
輔助車輛感知周圍環境
增強現實
為AR應用提供場景深度信息
實現更真實的虛擬物體疊加
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase