P

Poseless 3B

由homebrewltd開發
PoseLess是一種創新的機器人手部控制框架,通過使用投影表示直接將2D圖像映射到關節角度,無需顯式的姿態估計。
下載量 98
發布時間 : 3/3/2025

模型概述

該模型利用隨機關節配置生成的合成訓練數據,實現了對現實場景的零樣本泛化,以及從機械手到人手的跨形態遷移。通過投影視覺輸入並採用基於Transformer的解碼器,PoseLess在解決深度模糊性和數據稀缺性等挑戰的同時,實現了魯棒、低延遲的控制。

模型特點

無姿態估計的直接映射
通過使用投影表示直接將2D圖像映射到關節角度,無需顯式的姿態估計,減少了傳統兩階段流程中的誤差傳播。
合成數據生成
提出了一種合成數據生成流程,通過隨機化關節角度和視覺特徵生成無限訓練樣本,消除了對昂貴標註數據集的依賴。
跨形態泛化
展示了模型僅通過機械手數據訓練就能模仿人手運動的能力,實現了跨形態遷移。
無需深度信息
證明了無需深度信息的控制是可行的,為後續採用不支持深度估計功能的相機鋪平了道路。

模型能力

手部姿態估計
關節角度預測
跨形態遷移
圖像到關節的直接映射

使用案例

機器人控制
機械手控制
通過單目圖像直接控制機械手的關節角度,實現精確的運動控制。
在關節角度預測精度上具有競爭力
人手姿態估計
僅通過機械手數據訓練,實現對人手姿態的估計。
展示了跨形態泛化的能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase