Depth-Anything-V2-Large開源單目深度估計模型 - 精細深度細節，高魯棒性

首頁

Depth Anything V2 Large

由depth-anything開發

Depth Anything V2 是目前最強大的單目深度估計模型，基於大量合成和真實圖像訓練，提供精細的深度細節和高魯棒性。

3D視覺英語#單目深度估計 #精細細節還原 #高效輕量

下載量 130.54k

發布時間 : 6/13/2024

模型概述

Depth Anything V2 是一個單目深度估計模型，能夠從單張圖像中預測深度信息，適用於各種計算機視覺任務。

模型特點

精細深度細節

比V1版本呈現更精細的深度細節

高魯棒性

比V1和基於SD的模型更魯棒

高效輕量

比基於SD的模型快10倍且更輕量

大規模訓練

基於59.5萬張合成標註圖像和6200萬+真實無標註圖像訓練

模型能力

單目深度估計

相對深度預測

圖像深度分析

使用案例

計算機視覺

3D場景重建

從單張圖像重建3D場景

提供精確的相對深度信息

增強現實

為AR應用提供深度信息

實現更真實的虛擬物體放置

自動駕駛

輔助自動駕駛系統感知環境

提供場景深度信息

🚀 深度任意模型V2-Large

深度任意模型V2是一個單目深度估計（MDE）模型，它基於59.5萬張合成標註圖像和6200萬張以上的真實未標註圖像進行訓練。該模型具有高精度、強魯棒性、高效率等特點，能夠為圖像深度估計任務提供強大的支持。

🚀 快速開始

深度任意模型V2是基於59.5萬張合成標註圖像和6200萬張以上的真實未標註圖像訓練得到的單目深度估計（MDE）模型。它具有比深度任意模型V1更精細的細節、更強的魯棒性，比基於穩定擴散（SD）的模型更高效、更輕量級，並且使用預訓練模型進行微調能取得出色的性能。

✨ 主要特性

相較於深度任意模型V1，具有更精細的細節。
比深度任意模型V1和基於穩定擴散（SD）的模型（如Marigold、Geowizard）更具魯棒性。
比基於穩定擴散（SD）的模型更高效（快10倍）、更輕量級。
使用預訓練模型進行微調，能取得出色的性能。

📦 安裝指南

git clone https://huggingface.co/spaces/depth-anything/Depth-Anything-V2
cd Depth-Anything-V2
pip install -r requirements.txt

💻 使用示例

基礎用法

首先，下載模型並將其放置在checkpoints目錄下。

import cv2
import torch

from depth_anything_v2.dpt import DepthAnythingV2

model = DepthAnythingV2(encoder='vitl', features=256, out_channels=[256, 512, 1024, 1024])
model.load_state_dict(torch.load('checkpoints/depth_anything_v2_vitl.pth', map_location='cpu'))
model.eval()

raw_img = cv2.imread('your/image/path')
depth = model.infer_image(raw_img) # HxW raw depth map

📄 許可證

本項目採用CC BY-NC 4.0許可證。

📚 引用說明

如果您覺得本項目有用，請考慮引用以下文獻：

@article{depth_anything_v2,
  title={Depth Anything V2},
  author={Yang, Lihe and Kang, Bingyi and Huang, Zilong and Zhao, Zhen and Xu, Xiaogang and Feng, Jiashi and Zhao, Hengshuang},
  journal={arXiv:2406.09414},
  year={2024}
}

@inproceedings{depth_anything_v1,
  title={Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data}, 
  author={Yang, Lihe and Kang, Bingyi and Huang, Zilong and Xu, Xiaogang and Feng, Jiashi and Zhao, Hengshuang},
  booktitle={CVPR},
  year={2024}
}