V

Vitpose Plus Small

usyd-communityによって開発
ViTPose++はビジョントランスフォーマーを基盤とした人体姿勢推定モデルで、MS COCOキーポイント検出ベンチマークで81.1 APの優れた性能を達成しました。
ダウンロード数 30.02k
リリース時間 : 1/12/2025

モデル概要

ViTPose++は、人体姿勢推定タスクのためのシンプルで効果的なビジョントランスフォーマーのベースラインモデルです。階層化されていない標準的なビジョントランスフォーマーをバックボーンとして使用し、軽量なデコーダーで姿勢推定を行います。

モデル特徴

シンプルなアーキテクチャ
標準的なビジョントランスフォーマーをバックボーンとして使用し、複雑な設計なしで高性能を実現
高い拡張性
モデルパラメータを1億から10億までスケール可能で、スループットと性能の間でパレートフロンティアを確立
トレーニングの柔軟性
複数のアテンションタイプ、入力解像度、事前トレーニングおよびファインチューニング戦略をサポート
知識転移可能
大規模モデルの知識をシンプルな知識タグ付けで小規模モデルに転移可能

モデル能力

人体姿勢推定
複数人キーポイント検出
オクルージョン状況下での姿勢推定

使用事例

健康・フィットネス
運動姿勢分析
フィットネスアプリでユーザーの運動姿勢を分析
正確なキーポイント位置情報を提供し、姿勢矯正を支援
監視・セキュリティ
行動分析
監視シーンにおける人間の行動分析
異常行動パターンを識別可能
エンターテインメント
ゲームアニメーション
ゲームキャラクターのリアルな動きを生成
自然な人物動作キャプチャを実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase