Depth Anything開源深度估計模型 - 基於海量圖像訓練，免費實現精準深度估計

首頁

Depth Anything Large Hf

由LiheYoung開發

Depth Anything是基於DPT架構和DINOv2骨幹網絡的深度估計模型，在約6200萬張圖像上訓練，在相對和絕對深度估計任務中取得了最先進的結果。

3D視覺

Transformers

開源協議:Apache-2.0 #零樣本深度估計 #大規模無監督訓練 #DPT架構

下載量 147.17k

發布時間 : 1/23/2024

模型概述

該模型用於零樣本深度估計任務，能夠從單張圖像預測深度信息。

模型特點

大規模訓練數據

在約6200萬張圖像上進行訓練，提高了模型的泛化能力。

先進架構

採用DPT架構和DINOv2骨幹網絡，結合了Transformer的優勢。

零樣本能力

無需微調即可直接應用於深度估計任務。

模型能力

單圖像深度估計

零樣本深度預測

使用案例

計算機視覺

3D場景重建

從單張2D圖像預測深度信息，用於3D場景重建。

增強現實

為AR應用提供深度信息支持。

🚀 深度任意模型（大型模型，Transformer版本）

深度任意模型（Depth Anything）是一個用於深度估計的模型。它由Lihe Yang等人在論文深度任意模型：釋放大規模無標籤數據的力量中提出，並首次在此代碼庫中發佈。同時，還提供了在線演示。

聲明：發佈深度任意模型的團隊並未為此模型編寫模型卡片，此模型卡片由Hugging Face團隊編寫。

✨ 主要特性

深度任意模型採用了 DPT 架構，並以 DINOv2 為骨幹網絡。
該模型在約6200萬張圖像上進行訓練，在相對和絕對深度估計任務上均取得了最先進的成果。

深度任意模型概述

深度任意模型概述。取自原論文。

🚀 快速開始

預期用途和限制

你可以使用原始模型進行零樣本深度估計等任務。你可以在模型中心查找其他感興趣的版本。

如何使用

以下是使用此模型進行零樣本深度估計的示例代碼：

基礎用法

from transformers import pipeline
from PIL import Image
import requests

# 加載管道
pipe = pipeline(task="depth-estimation", model="LiheYoung/depth-anything-large-hf")

# 加載圖像
url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

# 推理
depth = pipe(image)["depth"]

高級用法

from transformers import AutoImageProcessor, AutoModelForDepthEstimation
import torch
import numpy as np
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

image_processor = AutoImageProcessor.from_pretrained("LiheYoung/depth-anything-large-hf")
model = AutoModelForDepthEstimation.from_pretrained("LiheYoung/depth-anything-large-hf")

# 為模型準備圖像
inputs = image_processor(images=image, return_tensors="pt")

with torch.no_grad():
    outputs = model(**inputs)
    predicted_depth = outputs.predicted_depth

# 插值到原始大小
prediction = torch.nn.functional.interpolate(
    predicted_depth.unsqueeze(1),
    size=image.size[::-1],
    mode="bicubic",
    align_corners=False,
)

更多代碼示例請參考文檔。

📚 詳細文檔

BibTeX引用和引用信息

@misc{yang2024depth,
      title={Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data}, 
      author={Lihe Yang and Bingyi Kang and Zilong Huang and Xiaogang Xu and Jiashi Feng and Hengshuang Zhao},
      year={2024},
      eprint={2401.10891},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}