V

Vitpose Base Coco Aic Mpii

usyd-communityによって開発
ViTPoseはビジョントランスフォーマーをベースとした人体姿勢推定モデルで、シンプルなアーキテクチャ設計によりMS COCOなどのベンチマークで優れた性能を発揮します。
ダウンロード数 38
リリース時間 : 1/8/2025

モデル概要

ViTPoseは標準的なビジョントランスフォーマーをバックボーンとして使用し、軽量デコーダーと組み合わせて人体姿勢推定を行い、1億から10億パラメータ規模までの拡張をサポートします。

モデル特徴

シンプルなアーキテクチャ
標準的なビジョントランスフォーマー構造のみを使用し、複雑なドメイン知識設計が不要
優れた拡張性
パラメータ規模を1億から10億まで拡張可能で、性能とスループットの新たなフロンティアを確立
柔軟なトレーニング
複数のアテンションタイプ、入力解像度、事前学習と微調整戦略をサポート
知識転移
知識トークンを使用して大規模モデルの知識を小規模モデルに転移可能

モデル能力

人体姿勢推定
複数人キーポイント検出
オクルージョンシーン分析

使用事例

健康・フィットネス
運動姿勢分析
フィットネス動作の正確性をリアルタイムで監視
17のキーポイントの正確な位置フィードバックを提供可能
インテリジェント監視
行動分析
公共スペースでの異常行動検出
オクルージョンシーン下でも80.9 APの精度を維持
デジタルエンターテインメント
モーションキャプチャ
ゲームキャラクターの動作駆動
複数人のリアルタイム姿勢推定をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase