S

Sapiens Pose 0.3b Torchscript

Developed by facebook
Sapiens是基于3亿张高分辨率人类图像预训练的视觉Transformer模型,专为姿态估计任务设计,支持308个关键点检测。
Downloads 55
Release Time : 9/13/2024

Model Overview

该模型用于单张图像的全身关键点(身体+面部+手部+足部)估计,在1024x768分辨率下表现出色。

Model Features

高分辨率支持
原生支持1024x768高分辨率输入,适合精细姿态分析
多部位关键点检测
同时检测身体、面部、手部和足部共308个关键点
强泛化能力
通过3亿张图像预训练,在真实场景中表现优异
高效推理
1.242万亿次浮点运算的计算量,平衡精度与效率

Model Capabilities

全身姿态估计
多部位关键点检测
高分辨率图像处理

Use Cases

动作分析
运动姿态分析
用于运动员动作捕捉和姿势纠正
可精确识别308个关键点
人机交互
手势识别
识别复杂手部动作
包含手部关键点检测
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase