D

Dpt Swinv2 Tiny 256

由Intel開發
基於SwinV2骨幹網絡的DPT模型,用於單目深度估計,在140萬張圖像上訓練。
下載量 2,285
發布時間 : 12/10/2023

模型概述

該模型是MiDaS 3.1版本的一部分,採用SwinV2變換器作為骨幹網絡,專注於從單張圖像中估計深度信息。適用於生成式AI、3D重建和自動駕駛等領域。

模型特點

基於SwinV2骨幹網絡
採用SwinV2變換器作為骨幹網絡,結合了分層變換器的優勢,提高了深度估計的效率和準確性。
大規模訓練數據
在140萬張圖像上進行訓練,涵蓋多種場景,增強了模型的泛化能力。
零樣本遷移能力
支持零樣本遷移,無需微調即可在新場景中應用。

模型能力

單目深度估計
零樣本遷移
圖像深度分析

使用案例

計算機視覺
3D重建
從單張圖像中估計深度信息,用於3D場景重建。
自動駕駛
用於自動駕駛系統中的環境感知和障礙物檢測。
生成式AI
為生成式AI提供深度信息,增強圖像生成的真實感。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase