S

Sapiens Pose 1b

由facebook開發
Pose-Sapiens-1B 是一個基於視覺 Transformer 架構的高分辨率人體姿態估計模型,在 3 億張 1024x1024 分辨率的人類圖像上預訓練,支持 308 個關鍵點檢測(身體、面部、手部和足部)。
下載量 82
發布時間 : 9/10/2024

模型概述

該模型專為高精度人體姿態估計設計,能夠在真實場景中表現出卓越的泛化能力,尤其適用於標註數據稀缺或完全合成的場景。

模型特點

高分辨率支持
原生支持 1K 高分辨率推理(1024x768),適合處理高精度圖像。
多部位關鍵點檢測
可同時檢測身體、面部、手部和足部的 308 個關鍵點。
強泛化能力
即使在標註數據稀缺或完全合成的場景下,也能在真實數據上表現出色。
大規模預訓練
基於 3 億張人類圖像的預訓練,學習豐富的姿態特徵表示。

模型能力

人體姿態估計
面部關鍵點檢測
手部關鍵點檢測
足部關鍵點檢測
高分辨率圖像處理

使用案例

動作分析與運動科學
運動員姿態分析
用於分析運動員的動作姿態,優化訓練效果。
可提供 308 個關鍵點的精確位置數據
虛擬現實與增強現實
虛擬化身控制
用於驅動虛擬化身的精確動作捕捉。
實現高保真的人體動作重現
醫療康復
康復訓練監測
監測患者的康復訓練動作是否正確。
提供精確的姿態評估數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase