Sapiens-pose-1b開源人體姿態估計模型 - 支持308個關鍵點檢測實用工具

Sapiens Pose 1b

由facebook開發

Pose-Sapiens-1B 是一個基於視覺 Transformer 架構的高分辨率人體姿態估計模型，在 3 億張 1024x1024 分辨率的人類圖像上預訓練，支持 308 個關鍵點檢測（身體、面部、手部和足部）。

下載量 82

發布時間 : 9/10/2024

模型概述

該模型專為高精度人體姿態估計設計，能夠在真實場景中表現出卓越的泛化能力，尤其適用於標註數據稀缺或完全合成的場景。

高分辨率支持

原生支持 1K 高分辨率推理（1024x768），適合處理高精度圖像。

多部位關鍵點檢測

可同時檢測身體、面部、手部和足部的 308 個關鍵點。

強泛化能力

即使在標註數據稀缺或完全合成的場景下，也能在真實數據上表現出色。

大規模預訓練

基於 3 億張人類圖像的預訓練，學習豐富的姿態特徵表示。

人體姿態估計

面部關鍵點檢測

手部關鍵點檢測

足部關鍵點檢測

高分辨率圖像處理

動作分析與運動科學

運動員姿態分析

用於分析運動員的動作姿態，優化訓練效果。

可提供 308 個關鍵點的精確位置數據

虛擬現實與增強現實

虛擬化身控制

用於驅動虛擬化身的精確動作捕捉。

實現高保真的人體動作重現

醫療康復

康復訓練監測

監測患者的康復訓練動作是否正確。

提供精確的姿態評估數據

屬性	詳情
開發者	Meta
模型類型	視覺變換器（Vision Transformer）
許可證	知識共享署名 - 非商業性使用 4.0（Creative Commons Attribution-NonCommercial 4.0）
任務	姿態估計
格式	原始格式
文件	sapiens_1b_goliath_best_goliath_AP_639.pth