開源Sapiens-pose-0.3b-torchscript模型 - 精準姿態估計，支持308個關鍵點檢測

首頁

Sapiens Pose 0.3b Torchscript

由facebook開發

Sapiens是基於3億張高分辨率人類圖像預訓練的視覺Transformer模型，專為姿態估計任務設計，支持308個關鍵點檢測。

姿態估計英語#高分辨率姿態估計 #全身關鍵點檢測 #3億圖像預訓練

下載量 55

發布時間 : 9/13/2024

模型概述

該模型用於單張圖像的全身關鍵點（身體+面部+手部+足部）估計，在1024x768分辨率下表現出色。

模型特點

高分辨率支持

原生支持1024x768高分辨率輸入，適合精細姿態分析

多部位關鍵點檢測

同時檢測身體、面部、手部和足部共308個關鍵點

強泛化能力

通過3億張圖像預訓練，在真實場景中表現優異

高效推理

1.242萬億次浮點運算的計算量，平衡精度與效率

模型能力

全身姿態估計

多部位關鍵點檢測

高分辨率圖像處理

使用案例

動作分析

運動姿態分析

用於運動員動作捕捉和姿勢糾正

可精確識別308個關鍵點

人機交互

手勢識別

識別複雜手部動作

包含手部關鍵點檢測

屬性	詳情
圖像尺寸	1024 x 768（高 x 寬）
參數數量	3.36 億
浮點運算次數	1.242 萬億次浮點運算
補丁尺寸	16 x 16
嵌入維度	1024
層數	24
頭數	16
前饋通道數	4096

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Sapiens Pose 0.3b Torchscript

模型概述

模型特點

模型能力

使用案例

🚀 Pose-Sapiens-0.3B-Torchscript

📚 詳細文檔

模型詳情

模型卡片

更多資源

💻 使用示例

📄 許可證