S

Sapiens Seg 0.3b Torchscript

由facebook開發
Sapiens 是一個基於 3 億張 1024 x 1024 分辨率人類圖像預訓練的視覺 Transformer 模型家族,支持 1K 高分辨率推理,在標註數據稀缺或完全合成的情況下仍能展現出對真實數據的卓越泛化能力。
下載量 56
發布時間 : 9/9/2024

模型概述

Seg 0.3B 模型可用於對人類圖像進行 28 類身體部位分割。

模型特點

高分辨率支持
原生支持 1K 高分辨率推理,圖像尺寸為 1024 x 768。
強大的泛化能力
即使在標註數據稀缺或完全合成的情況下,仍能展現出對真實數據的卓越泛化能力。
高效計算
計算量為 1.242 TFLOPs,分塊大小為 16 x 16,嵌入維度為 1024。

模型能力

人類圖像分割
高分辨率圖像處理
28 類身體部位識別

使用案例

醫療影像
身體部位分割
用於醫療影像中對人體各部位進行精確分割。
支持 28 類身體部位分割。
虛擬現實
虛擬形象創建
用於虛擬現實應用中創建高精度的人體模型。
高分辨率支持,提升虛擬形象的細節表現。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase