V

Vitpose Plus Huge

usyd-communityによって開発
ViTPose++はビジョントランスフォーマーを基盤とした人体姿勢推定の基本モデルで、MS COCOキーポイントテストセットで81.1 APという優れた性能を達成しました。
ダウンロード数 14.49k
リリース時間 : 1/12/2025

モデル概要

人体姿勢推定のためのビジョントランスフォーマーモデルで、シンプルなアーキテクチャで高性能を実現し、1億から10億パラメータまでのスケーラブルな規模をサポートします。

モデル特徴

シンプルなアーキテクチャ
標準的なビジョントランスフォーマーをバックボーンとして使用し、複雑なドメイン知識設計を必要としません
優れたスケーラビリティ
パラメータ規模を1億から10億まで拡張可能で、スループットと性能の間に新たなベンチマークを確立
高い柔軟性
複数のアテンションタイプ、入力解像度、トレーニング戦略をサポート
知識の転移性
大規模モデルの知識を知識トークンを通じて簡単に小規模モデルに転移可能

モデル能力

人体姿勢推定
複数人キーポイント検出
オクルージョンシーン処理

使用事例

健康・フィットネス
運動姿勢分析
フィットネス動作のキーポイント位置をリアルタイム追跡
姿勢矯正フィードバックを提供
インテリジェント監視
行動認識
連続的な姿勢変化を通じて異常行動を識別
デジタルコンテンツ制作
アニメーション駆動
実人物の動きを仮想キャラクターにマッピング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase