Sapiens Pose 1b
Pose-Sapiens-1Bは、ビジョントランスフォーマーアーキテクチャに基づく高解像度人体姿勢推定モデルで、3億枚の1024x1024解像度の人間画像で事前学習されており、308のキーポイント検出(身体、顔、手、足)をサポートします。
Downloads 82
Release Time : 9/10/2024
Model Overview
このモデルは高精度な人体姿勢推定のために設計されており、実世界のシナリオで優れた汎化性能を発揮し、特に注釈データが不足しているか完全に合成されたシナリオに適しています。
Model Features
高解像度サポート
1K高解像度推論(1024x768)をネイティブでサポートし、高精度画像処理に適しています。
多部位キーポイント検出
身体、顔、手、足の308のキーポイントを同時に検出できます。
強力な汎化能力
注釈データが不足しているか完全に合成されたシナリオでも、実データで優れた性能を発揮します。
大規模事前学習
3億枚の人間画像に基づく事前学習により、豊富な姿勢特徴表現を学習しています。
Model Capabilities
人体姿勢推定
顔キーポイント検出
手キーポイント検出
足キーポイント検出
高解像度画像処理
Use Cases
動作分析とスポーツ科学
アスリート姿勢分析
アスリートの動作姿勢を分析し、トレーニング効果を最適化します。
308のキーポイントの正確な位置データを提供可能
仮想現実と拡張現実
バーチャルアバター制御
バーチャルアバターの精密なモーションキャプチャに使用されます。
高精細な人体動作再現を実現
医療リハビリテーション
リハビリ訓練モニタリング
患者のリハビリ訓練動作が正しいかどうかを監視します。
正確な姿勢評価データを提供
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98