S

Sapiens Pose 0.6b

facebookによって開発
Sapiensは3億枚の高解像度人間画像で事前学習されたビジョントランスフォーマーモデルファミリーで、人間中心の視覚タスクに特化しています。
ダウンロード数 19
リリース時間 : 9/18/2024

モデル概要

Pose-Sapiens-0.6Bは姿勢推定用のビジョントランスフォーマーモデルで、単一画像上で308個のキーポイント(身体+顔+手+足)の推定をサポートします。

モデル特徴

高解像度サポート
1K高解像度推論をネイティブサポートし、画像サイズは1024 x 768まで対応可能です。
優れた汎化能力
アノテーションデータが不足している場合や完全に合成された場合でも、実データに対する優れた汎化能力を発揮します。
多キーポイント検出
身体、顔、手、足の合計308個のキーポイント推定をサポートします。

モデル能力

人体姿勢推定
顔キーポイント検出
手キーポイント検出
足キーポイント検出

使用事例

コンピュータビジョン
人体姿勢分析
運動分析、フィットネス指導などのシーンでの人体姿勢推定に使用されます。
仮想現実
仮想現実アプリケーションに正確な人体姿勢データを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase