Align3R开源模型 - 从单目视频估计深度、点云和姿态，免费可用！

首页

Align3r DepthPro ViTLarge BaseDecoder 512 Dpt

由 cyun9286 开发

Align3R 是一个从单目视频中估计时间一致的视频深度、动态点云和相机姿态的模型。

3D视觉

Safetensors

#单目视频深度估计 #动态点云生成 #时间一致性

下载量 227

发布时间 : 12/8/2024

模型简介

Align3R 是一个用于动态视频对齐单目深度估计的模型，能够从单目视频中提取时间一致的深度信息、动态点云和相机姿态。

模型特点

时间一致的深度估计

能够从单目视频中估计时间一致的深度信息，确保视频帧之间的深度连续性。

动态点云生成

可以从视频中生成动态点云，用于3D场景重建和分析。

相机姿态估计

能够估计视频中的相机姿态，用于运动分析和场景理解。

模型能力

单目深度估计

动态点云生成

相机姿态估计

视频处理

使用案例

3D重建

动态场景3D重建

从单目视频中重建动态场景的3D模型。

生成时间一致的深度图和动态点云。

增强现实

AR场景理解

通过估计深度和相机姿态，增强AR应用中的场景理解能力。

提供更准确的虚拟对象放置和交互。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Align3r DepthPro ViTLarge BaseDecoder 512 Dpt

模型简介

模型特点

模型能力

使用案例

🚀 Align3R

🚀 快速开始

📚 详细文档

📄 许可证