S

Sapiens Depth 0.3b

由facebook開發
智人(Sapiens)是基於3億張高分辨率人類圖像預訓練的視覺Transformer模型,專注於以人為中心的視覺任務。
下載量 24
發布時間 : 9/10/2024

模型概述

該模型用於人類圖像的相對深度估計,支持1K高分辨率推理,對真實數據具有卓越的泛化能力。

模型特點

高分辨率支持
原生支持1K高分辨率推理,適用於1024x768的圖像尺寸。
卓越泛化能力
即使在標註數據稀缺或完全合成的情況下,仍能對真實數據表現出色。
高效計算
計算量為1.242萬億次浮點運算,平衡了性能與效率。

模型能力

人類圖像深度估計
高分辨率圖像處理

使用案例

計算機視覺
人體深度感知
用於估計人類圖像的相對深度,適用於增強現實和虛擬現實應用。
在真實場景中表現出卓越的泛化能力。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase