P

Poseless 3B

homebrewltdによって開発
PoseLessは、明示的な姿勢推定を必要とせず、投影表現を使用して2D画像を直接関節角度にマッピングする革新的なロボットハンド制御フレームワークです。
ダウンロード数 98
リリース時間 : 3/3/2025

モデル概要

このモデルは、ランダムな関節構成から生成された合成トレーニングデータを利用し、現実のシナリオへのゼロショット汎化と、ロボットハンドから人間の手へのクロスモーフィズム転移を実現しています。投影された視覚入力を使用し、Transformerベースのデコーダを採用することで、PoseLessは深度の曖昧さやデータ不足といった課題を解決しつつ、ロバストで低遅延の制御を実現しています。

モデル特徴

姿勢推定不要の直接マッピング
投影表現を使用して2D画像を直接関節角度にマッピングすることで、明示的な姿勢推定を不要とし、従来の2段階プロセスにおける誤差伝播を低減します。
合成データ生成
関節角度と視覚特徴をランダム化することで無限のトレーニングサンプルを生成する合成データ生成プロセスを提案し、高価な注釈付きデータセットへの依存を解消します。
クロスモーフィズム汎化
ロボットハンドデータのみでトレーニングされたモデルが人間の手の動きを模倣できる能力を示し、クロスモーフィズム転移を実現しています。
深度情報不要
深度情報を必要としない制御が可能であることを証明し、深度推定機能をサポートしないカメラの採用への道を開きました。

モデル能力

ハンドポーズ推定
関節角度予測
クロスモーフィズム転移
画像から関節への直接マッピング

使用事例

ロボット制御
ロボットハンド制御
単眼画像から直接ロボットハンドの関節角度を制御し、精密な運動制御を実現します。
関節角度予測精度において競争力があります
人間の手のポーズ推定
ロボットハンドデータのみでトレーニングされたモデルが、人間の手のポーズを推定できます。
クロスモーフィズム汎化能力を示しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase