V

Vitpose Base Simple

danelcsbによって開発
ViTPoseは標準的なビジョントランスフォーマーを基にした人体姿勢推定ベースラインモデルで、シンプルなアーキテクチャで高性能なキーポイント検出を実現
ダウンロード数 20
リリース時間 : 11/20/2024

モデル概要

このモデルは非階層型ビジョントランスフォーマーをバックボーンとし、軽量デコーダーで姿勢推定を行い、MS COCOデータセットで81.1 APの優れた性能を達成

モデル特徴

アーキテクチャの簡潔性
標準的なビジョントランスフォーマーのみをバックボーンとして使用し、複雑な設計なしで高性能な姿勢推定を実現
規模のスケーラビリティ
モデルパラメータを1億から10億まで柔軟に拡張可能で、スループットと性能の間でパレートフロンティアを確立
トレーニングの柔軟性
複数のアテンションタイプ、入力解像度、事前学習戦略及びマルチタスク処理方案をサポート
知識の転移可能性
大規模モデルの知識をシンプルな知識トークンで小規模モデルに転移可能

モデル能力

人体キーポイント検出
マルチスケール姿勢推定
オクルージョンシーン処理
リアルタイム姿勢分析

使用事例

ヘルス&フィットネス
運動姿勢矯正
フィットネス動作のキーポイントをリアルタイム追跡し、標準化フィードバックを提供
セキュリティ監視
行動パターン分析
公共空間での異常な人体姿勢を検出
ゲーム&アニメーション
モーションキャプチャ
リアルなキャラクターアニメーションを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase