S

Sapiens Pose 0.6b

由facebook開發
Sapiens 是一個基於 3 億張高分辨率人類圖像預訓練的視覺 Transformer 模型家族,專注於以人為中心的視覺任務。
下載量 19
發布時間 : 9/18/2024

模型概述

Pose-Sapiens-0.6B 是一個用於姿態估計的視覺 Transformer 模型,支持單張圖像上 308 個關鍵點(身體+面部+手部+足部)的估計。

模型特點

高分辨率支持
原生支持 1K 高分辨率推理,圖像尺寸可達 1024 x 768。
卓越的泛化能力
即使在標註數據稀缺或完全合成的情況下,仍能展現出對真實數據的卓越泛化能力。
多關鍵點檢測
支持身體、面部、手部和足部共 308 個關鍵點的估計。

模型能力

人體姿態估計
面部關鍵點檢測
手部關鍵點檢測
足部關鍵點檢測

使用案例

計算機視覺
人體姿態分析
用於運動分析、健身指導等場景中的人體姿態估計。
虛擬現實
為虛擬現實應用提供精確的人體姿態數據。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase