Superpoint
その他
SuperPointは、自己教師あり学習で訓練された全畳み込みネットワークで、関心点検出と記述に使用されます。
姿勢推定
Transformers

S
magic-leap-community
59.12k
13
Vitpose Base Simple
Apache-2.0
ViTPoseは視覚Transformerベースの人体姿勢推定モデルで、MS COCOキーポイントテストセットで81.1 APの精度を達成し、モデルの簡潔さ、スケーラビリティ、トレーニングの柔軟性などの利点があります
姿勢推定
Transformers 英語

V
usyd-community
51.40k
20
Vitpose Plus Small
Apache-2.0
ViTPose++はビジョントランスフォーマーを基盤とした人体姿勢推定モデルで、MS COCOキーポイント検出ベンチマークで81.1 APの優れた性能を達成しました。
姿勢推定
Transformers

V
usyd-community
30.02k
2
Vitpose Plus Base
Apache-2.0
ViTPoseは視覚Transformerベースの人体姿勢推定モデルで、シンプルな設計によりMS COCOキーポイント検出ベンチマークで81.1 APの優れた性能を達成しました。
姿勢推定
Transformers 英語

V
usyd-community
22.26k
10
Superglue Outdoor
その他
SuperGlueはグラフニューラルネットワークベースの特徴マッチングモデルで、画像中の関心点をマッチングするために使用され、画像マッチングや姿勢推定タスクに適しています。
姿勢推定
Transformers

S
magic-leap-community
18.39k
2
Vitpose Plus Huge
Apache-2.0
ViTPose++はビジョントランスフォーマーを基盤とした人体姿勢推定の基本モデルで、MS COCOキーポイントテストセットで81.1 APという優れた性能を達成しました。
姿勢推定
Transformers

V
usyd-community
14.49k
6
Img2pose
img2poseはFaster R-CNNベースのモデルで、写真内の全ての顔の6自由度姿勢(6DoF)を予測し、3D顔を2D平面に投影できます。
姿勢推定
Safetensors
I
py-feat
4,440
0
Vitpose Plus Large
Apache-2.0
ViTPose++はビジョントランスフォーマーに基づく人体姿勢推定の基本モデルで、MS COCOキーポイントテストセットで81.1 APの優れた性能を達成しました。
姿勢推定
Transformers

V
usyd-community
1,731
1
Synthpose Vitpose Huge Hf
Apache-2.0
SynthPoseはVitPose巨大バックボーンネットワークを基にしたキーポイント検出モデルで、合成データによるファインチューニングにより52の人体キーポイントを予測し、運動学分析に適しています。
姿勢推定
Transformers

S
stanfordmimi
1,320
1
Sapiens Pose 1b Torchscript
Sapiensは3億枚の1024x1024解像度人体画像で事前学習された視覚Transformerモデルで、高精度な姿勢推定タスクのために設計されています。
姿勢推定 英語
S
facebook
1,245
7
Synthpose Vitpose Base Hf
Apache-2.0
SynthPoseはVitPose Baseをベースとした2D人体姿勢推定モデルで、合成データによる微調整を行い、52の解剖学的キーポイントを予測可能
姿勢推定
Transformers

S
stanfordmimi
931
3
Reloc3r 512
Reloc3rは、事前学習済みの双視点相対カメラ姿勢回帰ネットワークと多視点運動平均モジュールを組み合わせた、簡潔で効率的なカメラ姿勢推定フレームワークです。
姿勢推定
R
siyan824
840
4
Vitpose Base
Apache-2.0
ビジョントランスフォーマーを基盤とした人体姿勢推定モデルで、MS COCOキーポイントテストセットで81.1 APの優れた性能を達成
姿勢推定
Transformers 英語

V
usyd-community
761
9
Lightglue Superpoint
その他
LightGlueは、コンピュータビジョンにおける特徴マッチングと姿勢推定の問題に使用される、効率的なキーポイント検出とマッチングモデルです。
姿勢推定
Transformers

L
ETH-CVG
316
20
Reloc3r 224
Reloc3rは、視覚位置推定のための大規模相対カメラ姿勢回帰モデルで、汎用性、高速性、高精度を特徴としています。
姿勢推定
R
siyan824
172
2
Vitpose Base Simple
これはtransformersベースのキーポイント検出モデルで、画像内のキーポイント位置を識別します
姿勢推定
Transformers

V
nielsr
109
1
Sapiens Pose Bbox Detector
Apache-2.0
RTMDet検出器は、Sapiens姿勢推定モデルとの連携のために特別に設計された効率的な検出器で、人体キーポイント検出タスクに使用されます。
姿勢推定
S
facebook
107
3
Sapiens Pose 1b
Pose-Sapiens-1Bは、ビジョントランスフォーマーアーキテクチャに基づく高解像度人体姿勢推定モデルで、3億枚の1024x1024解像度の人間画像で事前学習されており、308のキーポイント検出(身体、顔、手、足)をサポートします。
姿勢推定 英語
S
facebook
82
4
Poseless 3B
Apache-2.0
Poseless-3Bは、視覚言語モデル(VLM)ベースのロボットハンド制御フレームワークで、明示的な姿勢推定なしに2D画像を関節角度に直接マッピングできます。
姿勢推定
Transformers

P
Menlo
65
10
Sapiens Pose 0.3b Torchscript
Sapiensは3億枚の高解像度人間画像で事前学習された視覚Transformerモデルで、姿勢推定タスク向けに設計されており、308のキーポイント検出をサポートします。
姿勢推定 英語
S
facebook
55
1
Vitpose Base Coco Aic Mpii
Apache-2.0
ViTPoseはビジョントランスフォーマーをベースとした人体姿勢推定モデルで、シンプルなアーキテクチャ設計によりMS COCOなどのベンチマークで優れた性能を発揮します。
姿勢推定
Transformers 英語

V
usyd-community
38
1
Vitpose Base Simple
ViTアーキテクチャに基づく軽量な姿勢推定モデルで、人体のキーポイント検出に使用されます
姿勢推定
Transformers

V
onnx-community
31
3
Sapiens Pose 1b Bfloat16
Sapiensは3億枚の1024x1024解像度の人間画像で事前学習されたビジョントランスフォーマーシリーズモデルで、人間中心の視覚タスクに特化しています。
姿勢推定 英語
S
facebook
31
0
Sapiens Pose 0.6b Torchscript
Sapiensは3億枚の高解像度人間画像で事前学習された視覚Transformerモデルで、姿勢推定タスク向けに設計されており、308のキーポイント検出をサポートします。
姿勢推定 英語
S
facebook
29
0
Diffusion Pusht Keypoints
Apache-2.0
Diffusion Policyでトレーニングされたロボット制御モデルで、PushTタスク専用に設計されており、キーポイント観測データを使用してトレーニングされています
姿勢推定
Transformers

D
lerobot
21
0
Vitpose Base Simple
Apache-2.0
ViTPoseは標準的なビジョントランスフォーマーを基にした人体姿勢推定ベースラインモデルで、シンプルなアーキテクチャで高性能なキーポイント検出を実現
姿勢推定
Transformers 英語

V
danelcsb
20
1
Sapiens Pose 0.6b
Sapiensは3億枚の高解像度人間画像で事前学習されたビジョントランスフォーマーモデルファミリーで、人間中心の視覚タスクに特化しています。
姿勢推定 英語
S
facebook
19
2
Vitpose
このモデルは画像や動画内のキーポイントを検出するために使用され、人体姿勢推定や顔の特徴点検出などのタスクに適しています。
姿勢推定
Transformers

V
shauray
19
0