DUSt3Rオープンソース3Dビジョンモデル - 単一または複数の画像から簡単に3Dシーンを再構築

ホーム

Dust3r ViTLarge BaseDecoder 224 Linear

naverによって開発

DUSt3Rは、画像から簡単に幾何学的3Dビジョンを実現するモデルで、単一または複数の画像から3Dシーンを再構築できます。

3Dビジョン

Safetensors

#画像から3D #幾何学的再構築 #ViTアーキテクチャ

ダウンロード数 1,829

リリース時間 : 6/19/2024

モデル概要

DUSt3RはViTアーキテクチャに基づく3Dビジョンモデルで、2D画像から3D幾何学情報を復元することに特化しています。非対称なCroCo3DStereoアーキテクチャを採用し、単一ビューまたはマルチビューの入力を処理し、3Dシーンの幾何学的構造を出力します。

モデル特徴

単一ビューおよびマルチビュー3D再構築

単一または複数の画像から3D幾何学的構造を再構築可能

効率的なViTアーキテクチャ

Vision Transformerアーキテクチャを使用し、大規模エンコーダと小型デコーダを組み合わせ

高解像度処理

224x224ピクセルの入力解像度をサポート

モデル能力

3Dシーン再構築

幾何学的形状復元

深度推定

点群生成

使用事例

コンピュータビジョン

3Dシーン再構築

単一または複数の2D画像から3Dシーンを再構築

シーンの3D幾何学的構造と深度情報を生成

拡張現実

ARアプリケーションに3D環境理解を提供

ロボットビジョン

環境認識

ロボットが周囲環境の3D構造を理解するのを支援

🚀 DUSt3R: 幾何学的3Dビジョンを簡単に

DUSt3Rは、幾何学的3Dビジョンを簡単に実現するモデルです。このモデルは、画像から3D情報を抽出するための効果的な手段を提供します。

🚀 クイックスタート

まずは、dust3rをインストールします。モデルをロードするには、以下のコードを実行します。

基本的な使用法

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_224_linear")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

📚 ドキュメント

引用情報

@inproceedings{dust3r_cvpr24,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      booktitle = {CVPR},
      year = {2024}
}

@misc{dust3r_arxiv23,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      year={2023},
      eprint={2312.14132},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2312.14132}, 
}

モデル情報

Gihubページ: https://github.com/naver/dust3r/
プロジェクトページ: https://dust3r.europe.naverlabs.com/

属性	详情
モデル名	DUSt3R_ViTLarge_BaseDecoder_224_linear
学習解像度	224x224
ヘッド	Linear
エンコーダ	ViT-L
デコーダ	ViT-B

📄 ライセンス

コードはCC BY-NC-SA 4.0ライセンスの下で配布されています。詳細については、ライセンスを参照してください。チェックポイントについては、CC-BY-NC-SA 4.0に加えて、使用したすべての公開学習データセットとベースチェックポイントのライセンスに同意する必要があります。詳細は、セクション: ハイパーパラメータを参照してください。