Prompt Depth Anything Vits Hf
一种高分辨率精确度量深度估计方法,采用提示机制释放深度基础模型的潜力
Downloads 2,396
Release Time : 12/23/2024
Model Overview
提示深度全能是一种基于提示机制的高分辨率深度估计方法,能够生成高达4K分辨率的精确度量深度图。该方法灵感源自视觉语言模型和大型语言模型中的提示技术,通过iPhone激光雷达等提示信号引导模型输出。
Model Features
提示机制
借鉴视觉语言模型和大型语言模型中的提示技术,通过提示信号引导模型生成精确深度
高分辨率输出
能够生成高达4K分辨率的精确度量深度图
可扩展训练管道
引入了可扩展的数据训练管道,提升模型性能
多应用支持
显著提升三维重建和通用机器人抓取等下游应用效果
Model Capabilities
高精度深度估计
4K分辨率深度图生成
基于提示信号的深度预测
Use Cases
三维重建
高精度三维场景重建
利用模型生成的高分辨率深度图进行三维场景重建
显著提升重建精度和细节表现
机器人应用
通用机器人抓取
为机器人提供精确的环境深度信息以辅助抓取决策
提升抓取成功率和精确度
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98