Prompt Depth Anything Vits Hf
一種高分辨率精確度量深度估計方法,採用提示機制釋放深度基礎模型的潛力
Downloads 2,396
Release Time : 12/23/2024
Model Overview
提示深度全能是一種基於提示機制的高分辨率深度估計方法,能夠生成高達4K分辨率的精確度量深度圖。該方法靈感源自視覺語言模型和大型語言模型中的提示技術,通過iPhone激光雷達等提示信號引導模型輸出。
Model Features
提示機制
借鑑視覺語言模型和大型語言模型中的提示技術,通過提示信號引導模型生成精確深度
高分辨率輸出
能夠生成高達4K分辨率的精確度量深度圖
可擴展訓練管道
引入了可擴展的數據訓練管道,提升模型性能
多應用支持
顯著提升三維重建和通用機器人抓取等下游應用效果
Model Capabilities
高精度深度估計
4K分辨率深度圖生成
基於提示信號的深度預測
Use Cases
三維重建
高精度三維場景重建
利用模型生成的高分辨率深度圖進行三維場景重建
顯著提升重建精度和細節表現
機器人應用
通用機器人抓取
為機器人提供精確的環境深度信息以輔助抓取決策
提升抓取成功率和精確度
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98