D

Dpt Beit Large 384

由Intel開發
基於BEiT骨幹網絡的單目深度估計模型,能夠從單張圖像推斷詳細深度信息
下載量 135
發布時間 : 11/28/2023

模型概述

該DPT模型使用BEiT模型作為骨幹網絡,並在頂部添加了用於單目深度估計的頸部結構和頭部。主要用於從單張圖像或單一視角推斷詳細深度信息。

模型特點

BEiT骨幹網絡
使用BEiT Transformer作為骨幹網絡,可實現最高質量的深度估計
零樣本遷移
支持零樣本深度估計,無需針對特定場景進行微調
多分辨率支持
提供384x384和512x512等多種訓練分辨率版本

模型能力

單目深度估計
圖像深度圖生成
零樣本遷移學習

使用案例

計算機視覺
3D重建
從單張圖像生成深度信息用於3D場景重建
自動駕駛
為自動駕駛系統提供環境深度感知
增強現實
為AR應用提供場景深度信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase