Depth - Anything - V2 - Baseオープンソース単目深度推定モデル

Home

Depth Anything V2 Base

Developed by depth-anything

Depth Anything V2は現在最も強力な単眼深度推定(MDE)モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされています

3Dビジョン English#単眼深度推定 #高精度ディテール #軽量で効率的

Downloads 66.95k

Release Time : 6/13/2024

Model Overview

単眼深度推定のための視覚モデルで、単一画像から深度情報を予測できます

Model Features

微細なディテール捕捉

V1バージョンと比べてより微細な深度ディテールを捕捉可能

高いロバスト性

V1バージョンやSDベースのモデル(例:Marigold/Geowizard)よりもロバスト

効率的で軽量

SDベースのモデルよりも効率的(10倍高速)で軽量

ファインチューニング適性

事前学習モデルを使用したファインチューニングで驚くべき効果が得られます

Model Capabilities

単眼深度推定

相対深度予測

画像深度分析

Use Cases

コンピュータビジョン

3Dシーン再構築

単一の2D画像から3Dシーンを再構築

正確な相対深度マップを生成

拡張現実

ARアプリケーションに深度情報を提供

よりリアルな仮想物体配置を実現

🚀 Depth-Anything-V2-Base

Depth Anything V2は、595Kの合成ラベル付き画像と62M以上の実際のラベル無し画像から学習された、最も高性能な単眼深度推定（MDE）モデルを提供します。以下の特徴があります。

Depth Anything V1よりも細かい詳細を捉えることができます。
Depth Anything V1やSDベースのモデル（例：Marigold、Geowizard）よりも堅牢です。
SDベースのモデルよりも効率的（10倍高速）かつ軽量です。
事前学習モデルを用いたファインチューニングでも印象的な性能を発揮します。

🚀 クイックスタート

このセクションでは、Depth-Anything-V2の基本的な使い方を説明します。

✨ 主な機能

細かい詳細の捉え方：Depth Anything V1よりも細かい詳細を捉えることができます。
堅牢性：Depth Anything V1やSDベースのモデル（例：Marigold、Geowizard）よりも堅牢です。
効率性と軽量性：SDベースのモデルよりも効率的（10倍高速）かつ軽量です。
ファインチューニング性能：事前学習モデルを用いたファインチューニングでも印象的な性能を発揮します。

📦 インストール

以下のコマンドを実行して、Depth-Anything-V2をインストールします。

git clone https://huggingface.co/spaces/depth-anything/Depth-Anything-V2
cd Depth-Anything-V2
pip install -r requirements.txt

💻 使用例

基本的な使用法

まず、モデルをダウンロードし、checkpointsディレクトリに配置します。

import cv2
import torch

from depth_anything_v2.dpt import DepthAnythingV2

model = DepthAnythingV2(encoder='vitb', features=128, out_channels=[96, 192, 384, 768])
model.load_state_dict(torch.load('checkpoints/depth_anything_v2_vitb.pth', map_location='cpu'))
model.eval()

raw_img = cv2.imread('your/image/path')
depth = model.infer_image(raw_img) # HxW raw depth map

📚 ドキュメント

このセクションでは、Depth-Anything-V2の詳細な使い方を説明します。

📄 ライセンス

このプロジェクトは、CC BY-NC 4.0ライセンスの下で公開されています。

📚 引用

もしこのプロジェクトが役に立った場合は、以下の文献を引用してください。

@article{depth_anything_v2,
  title={Depth Anything V2},
  author={Yang, Lihe and Kang, Bingyi and Huang, Zilong and Zhao, Zhen and Xu, Xiaogang and Feng, Jiashi and Zhao, Hengshuang},
  journal={arXiv:2406.09414},
  year={2024}
}

@inproceedings{depth_anything_v1,
  title={Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data}, 
  author={Yang, Lihe and Kang, Bingyi and Huang, Zilong and Xu, Xiaogang and Feng, Jiashi and Zhao, Hengshuang},
  booktitle={CVPR},
  year={2024}
}