S

Sapiens Seg 1b Bfloat16

由facebook開發
Sapiens是基於3億張高分辨率人類圖像預訓練的視覺Transformer模型,專注於以人為中心的視覺任務
下載量 42
發布時間 : 9/10/2024

模型概述

該模型用於對人類圖像進行28類身體部位分割,支持1K高分辨率推理,在真實場景中展現出卓越的泛化能力

模型特點

高分辨率支持
原生支持1024x1024分辨率輸入,適合高精度分割任務
大規模預訓練
基於3億張人類圖像預訓練,學習豐富的視覺特徵
真實場景泛化
即使在標註數據稀缺或完全合成的情況下,也能對真實數據保持良好性能
高效推理
採用bfloat16格式優化,平衡精度與計算效率

模型能力

人體部位分割
高分辨率圖像處理
多類別語義分割

使用案例

醫療影像
手術規劃輔助
用於術前對人體解剖結構的精確分割
提供28類身體部位的精確分割結果
虛擬現實
虛擬形象創建
用於生成高保真虛擬人物的身體部位分割
支持真實感虛擬形象的身體部位識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase