D

Dust3r ViTLarge BaseDecoder 224 Linear

由naver開發
DUSt3R是一個用於從圖像輕鬆實現幾何3D視覺的模型,能夠從單張或多張圖像重建3D場景。
下載量 1,829
發布時間 : 6/19/2024

模型概述

DUSt3R是一個基於ViT架構的3D視覺模型,專注於從2D圖像中恢復3D幾何信息。它採用非對稱的CroCo3DStereo架構,能夠處理單視圖或多視圖輸入,輸出3D場景的幾何結構。

模型特點

單視圖和多視圖3D重建
能夠從單張或多張圖像中重建3D幾何結構
高效的ViT架構
使用Vision Transformer架構,結合大型編碼器和小型解碼器
高分辨率處理
支持224x224像素的輸入分辨率

模型能力

3D場景重建
幾何形狀恢復
深度估計
點雲生成

使用案例

計算機視覺
3D場景重建
從單張或多張2D圖像重建3D場景
生成場景的3D幾何結構和深度信息
增強現實
為AR應用提供3D環境理解
機器人視覺
環境感知
幫助機器人理解周圍環境的3D結構
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase