S

Sapiens Pose 0.3b Torchscript

由facebook開發
Sapiens是基於3億張高分辨率人類圖像預訓練的視覺Transformer模型,專為姿態估計任務設計,支持308個關鍵點檢測。
下載量 55
發布時間 : 9/13/2024

模型概述

該模型用於單張圖像的全身關鍵點(身體+面部+手部+足部)估計,在1024x768分辨率下表現出色。

模型特點

高分辨率支持
原生支持1024x768高分辨率輸入,適合精細姿態分析
多部位關鍵點檢測
同時檢測身體、面部、手部和足部共308個關鍵點
強泛化能力
通過3億張圖像預訓練,在真實場景中表現優異
高效推理
1.242萬億次浮點運算的計算量,平衡精度與效率

模型能力

全身姿態估計
多部位關鍵點檢測
高分辨率圖像處理

使用案例

動作分析
運動姿態分析
用於運動員動作捕捉和姿勢糾正
可精確識別308個關鍵點
人機交互
手勢識別
識別複雜手部動作
包含手部關鍵點檢測
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase