S

Sapiens Depth 0.3b Torchscript

由facebook開發
Sapiens 是一個基於 3 億張 1024 x 1024 分辨率人類圖像預訓練的視覺變換器家族,用於深度估計任務。
下載量 69
發布時間 : 9/9/2024

模型概述

Sapiens-0.3B 是一個視覺變換器模型,專門用於估計人類圖像的相對深度。該模型在 1K 高分辨率下表現出色,能夠泛化至真實場景。

模型特點

高分辨率支持
原生支持 1K 高分辨率推理,適用於高精度深度估計任務。
強大的泛化能力
即使在標註數據稀缺或完全合成的情況下,也能展現出對真實數據的出色泛化能力。
大規模預訓練
基於 3 億張 1024 x 1024 分辨率人類圖像預訓練,具備強大的特徵提取能力。

模型能力

人類圖像深度估計
高分辨率圖像處理
真實場景泛化

使用案例

計算機視覺
虛擬現實
用於虛擬現實應用中的人類深度估計,提升場景的真實感。
增強現實
在增強現實應用中,準確估計人類深度以實現更自然的交互。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase