R

Rdt 170m

由robotics-diffusion-transformer開發
RDT-170M是一個擁有1.7億參數的模仿學習擴散Transformer模型,用於機器人視覺-語言-動作任務。
下載量 278
發布時間 : 10/23/2024

模型概述

RDT-170M是一個基於Transformer的擴散策略模型,能夠根據語言指令和多視角RGB圖像預測未來64個機器人動作,兼容多種移動機械臂平臺。

模型特點

多模態輸入支持
支持語言指令和多達三個視角的RGB圖像輸入
廣泛兼容性
兼容單臂/雙臂、關節空間/末端執行器空間、位置控制/速度控制等多種機器人平臺
統一動作空間
通過統一動作空間支持多種機器人控制方式
大規模預訓練
基於46個機器人數據集進行預訓練

模型能力

視覺-語言理解
機器人動作預測
多模態融合
擴散模型推理

使用案例

機器人控制
移動機械臂控制
根據語言指令和視覺輸入控制移動機械臂執行任務
可預測未來64個機器人動作
雙臂協調操作
控制雙臂機器人完成協調操作任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase