Align3r DepthPro ViTLarge BaseDecoder 512 Dpt
Align3R 是一個從單目視頻中估計時間一致的視頻深度、動態點雲和相機姿態的模型。
下載量 227
發布時間 : 12/8/2024
模型概述
Align3R 是一個用於動態視頻對齊單目深度估計的模型,能夠從單目視頻中提取時間一致的深度信息、動態點雲和相機姿態。
模型特點
時間一致的深度估計
能夠從單目視頻中估計時間一致的深度信息,確保視頻幀之間的深度連續性。
動態點雲生成
可以從視頻中生成動態點雲,用於3D場景重建和分析。
相機姿態估計
能夠估計視頻中的相機姿態,用於運動分析和場景理解。
模型能力
單目深度估計
動態點雲生成
相機姿態估計
視頻處理
使用案例
3D重建
動態場景3D重建
從單目視頻中重建動態場景的3D模型。
生成時間一致的深度圖和動態點雲。
增強現實
AR場景理解
通過估計深度和相機姿態,增強AR應用中的場景理解能力。
提供更準確的虛擬對象放置和交互。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98