開源DUSt3R模型 - 輕鬆從圖像生成3D幾何模型，搞定3D視覺任務

Home

Dust3r ViTLarge BaseDecoder 512 Linear

Developed by naver

DUSt3R是一個用於從圖像生成3D幾何模型的深度學習模型，能夠輕鬆實現幾何3D視覺任務。

3D視覺

Safetensors

#圖像轉3D #幾何重建 #多視角融合

Downloads 313

Release Time : 6/21/2024

Model Overview

DUSt3R是一個基於ViT架構的深度學習模型，專注於從2D圖像生成3D幾何結構。它採用非對稱CroCo3DStereo架構，能夠處理不同分辨率的輸入圖像。

Model Features

多分辨率支持

支持多種輸入分辨率(512x384到512x160)，適應不同場景需求

高效3D重建

能夠從單張或多張2D圖像快速重建3D幾何結構

混合ViT架構

結合ViT-Large編碼器和ViT-Base解碼器，平衡性能和效率

Model Capabilities

單圖像3D重建

多視圖3D重建

幾何結構估計

深度估計

Use Cases

計算機視覺

場景重建

從單張或多張照片重建室內外場景的3D幾何結構

可生成場景的3D點雲或網格表示

物體建模

從物體照片生成3D模型

可用於AR/VR內容創建或3D打印

機器人視覺

環境感知

為機器人提供環境的3D幾何理解

支持機器人導航和避障

🚀 DUSt3R：讓幾何3D視覺變得簡單

DUSt3R是一個致力於簡化幾何3D視覺的項目，它提供了便捷的模型使用方式，能幫助開發者更輕鬆地開展相關工作。

🚀 快速開始

首先，你需要安裝dust3r。然後，按照以下代碼加載模型：

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_512_linear")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

✨ 主要特性

提供了便捷的圖像到3D轉換功能。
支持多種訓練分辨率，適應不同的應用場景。

📦 安裝指南

請參考安裝說明進行安裝。

💻 使用示例

基礎用法

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_512_linear")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

📚 詳細文檔

GitHub頁面：https://github.com/naver/dust3r/
項目頁面：https://dust3r.europe.naverlabs.com/

模型信息

屬性	詳情
模型名稱	DUSt3R_ViTLarge_BaseDecoder_512_linear
訓練分辨率	512x384, 512x336, 512x288, 512x256, 512x160
頭部	Linear
編碼器	ViT-L
解碼器	ViT-B

🔧 技術細節

該項目的相關論文信息如下：

@inproceedings{dust3r_cvpr24,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      booktitle = {CVPR},
      year = {2024}
}

@misc{dust3r_arxiv23,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      year={2023},
      eprint={2312.14132},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2312.14132}, 
}