開源Sapiens-depth-0.6b-torchscript模型 - 高效處理以人為中心的視覺任務

Sapiens Depth 0.6b Torchscript

由facebook開發

Sapiens 是一個基於 3 億張 1024 x 1024 分辨率人類圖像預訓練的視覺變換器系列模型，專注於以人為中心的視覺任務。

下載量 34

發布時間 : 9/9/2024

模型概述

該模型用於估計人類圖像的相對深度，支持高分辨率推理，並在真實數據上展現出卓越的泛化能力。

高分辨率支持

原生支持 1K 高分辨率推理，適用於高質量圖像處理。

卓越泛化能力

即使在標註數據稀缺或完全合成的情況下，也能展現出對真實數據的卓越泛化能力。

大規模預訓練

基於 3 億張 1024 x 1024 分辨率人類圖像預訓練，具備強大的特徵提取能力。

人類圖像深度估計

高分辨率圖像處理

計算機視覺

人體深度估計

用於估計人類圖像的相對深度，適用於虛擬現實、增強現實等場景。

在真實數據上展現出卓越的泛化能力。

屬性	詳情
開發者	Meta
模型類型	視覺變換器
許可證	知識共享署名-非商業性使用 4.0 國際許可協議
任務	深度估計
格式	torchscript
文件	sapiens_0.6b_render_people_epoch_70_torchscript.pt2