Lotus Depth G V2 0 Disparity
Lotus是一个基于扩散模型的视觉基础模型,专注于高质量密集预测任务,如深度估计。相比前一版本,本模型在视差空间(逆深度)进行训练,实现了更优性能和更稳定的视频深度估计。
Downloads 182
Release Time : 11/13/2024
Model Overview
Lotus是一个官方模型系列,专注于深度估计任务。通过扩散模型架构,在视差空间进行训练,提供高质量的密集预测结果。
Model Features
视差空间训练
在逆深度空间进行训练,相比传统深度空间训练,实现了更优的性能和更稳定的视频深度估计结果。
高质量密集预测
能够生成高质量的密集预测结果,适用于各种复杂场景。
视频深度估计
特别优化了视频深度估计的稳定性,适合连续帧处理。
Model Capabilities
单图像深度估计
视频深度估计
密集预测
Use Cases
计算机视觉
3D场景重建
从单张图像或视频序列中估计深度信息,用于3D场景重建。
高质量深度图,可用于精确的3D建模
增强现实
为AR应用提供实时深度信息,增强虚拟物体的真实感。
稳定的视频深度估计,提高AR体验质量
自动驾驶
环境感知
帮助自动驾驶系统理解周围环境的3D结构。
准确的深度估计,提高环境感知能力
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98