MASt3R開源圖像轉3D模型 - 免費部署實現圖像與3D空間精準匹配

首頁

Mast3r ViTLarge BaseDecoder 512 Catmlpdpt Metric

由naver開發

MASt3R是一個基於ViT架構的圖像轉3D模型，能夠實現圖像與3D空間的匹配

3D視覺

Safetensors

#圖像3D匹配 #非度量空間重建 #多分辨率處理

下載量 116.60k

發布時間 : 7/9/2024

模型概述

該模型主要用於將2D圖像轉換為3D空間表示，實現圖像與3D空間的精確匹配，基於DUSt3R技術改進而來

模型特點

多分辨率支持

支持512x384到512x160等多種輸入分辨率

非度量輸出

採用非度量方式處理3D空間信息

混合架構

結合ViT-Large編碼器和ViT-Base解碼器的優勢

模型能力

2D圖像到3D空間轉換

多視角圖像匹配

3D場景重建

使用案例

計算機視覺

增強現實

將現實世界圖像與虛擬3D空間對齊

實現更精確的AR體驗

3D建模

從單張或多張圖像重建3D模型

簡化3D建模流程

屬性	詳情
模型名稱	MASt3R_ViTLarge_BaseDecoder_512_catmlpdpt_nonmetric
訓練分辨率	512x384, 512x336, 512x288, 512x256, 512x160
頭部	CatMLP+DPT
編碼器	ViT-L
解碼器	ViT-B

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Mast3r ViTLarge BaseDecoder 512 Catmlpdpt Metric

模型概述

模型特點

模型能力

使用案例

🚀 基於MASt3R的3D圖像匹配

🚀 快速開始

💻 使用示例

基礎用法

📚 詳細文檔

模型信息

引用信息

📄 許可證