D

Diffusion Pusht Keypoints

由lerobot開發
基於Diffusion Policy訓練的機器人控制模型,專為PushT任務設計,使用關鍵點觀測數據進行訓練
下載量 21
發布時間 : 7/5/2024

模型概述

該模型採用Diffusion Policy方法,通過將觀測數據與智能體位置編碼結合作為條件輸入,實現在gym-pusht環境中僅使用關鍵點觀測的PushT任務控制

模型特點

關鍵點條件訓練
將觀測數據與智能體位置編碼結合作為去噪U-Net的全局條件輸入
高效訓練
在NVIDIA RTX H100顯卡上僅需約5小時完成訓練
高性能表現
在PushT任務中達到0.97的平均最大重疊率和71%的成功率

模型能力

機器人動作規劃
基於視覺關鍵點的控制
連續動作空間決策

使用案例

機器人控制
PushT任務執行
在gym-pusht環境中完成推箱任務
平均最大重疊率0.97,成功率71%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase