Align3R開源模型 - 從單目視頻估計深度、點雲和姿態，免費可用！

首頁

Align3r DepthPro ViTLarge BaseDecoder 512 Dpt

由cyun9286開發

Align3R 是一個從單目視頻中估計時間一致的視頻深度、動態點雲和相機姿態的模型。

3D視覺

Safetensors

#單目視頻深度估計 #動態點雲生成 #時間一致性

下載量 227

發布時間 : 12/8/2024

模型概述

Align3R 是一個用於動態視頻對齊單目深度估計的模型，能夠從單目視頻中提取時間一致的深度信息、動態點雲和相機姿態。

模型特點

時間一致的深度估計

能夠從單目視頻中估計時間一致的深度信息，確保視頻幀之間的深度連續性。

動態點雲生成

可以從視頻中生成動態點雲，用於3D場景重建和分析。

相機姿態估計

能夠估計視頻中的相機姿態，用於運動分析和場景理解。

模型能力

單目深度估計

動態點雲生成

相機姿態估計

視頻處理

使用案例

3D重建

動態場景3D重建

從單目視頻中重建動態場景的3D模型。

生成時間一致的深度圖和動態點雲。

增強現實

AR場景理解

通過估計深度和相機姿態，增強AR應用中的場景理解能力。

提供更準確的虛擬對象放置和交互。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Align3r DepthPro ViTLarge BaseDecoder 512 Dpt

模型概述

模型特點

模型能力

使用案例

🚀 Align3R

🚀 快速開始

📚 詳細文檔

📄 許可證