R

Rdt 1b

由robotics-diffusion-transformer開發
基於100萬+多機器人操作數據預訓練的10億參數模仿學習擴散Transformer模型,支持多視角視覺語言動作預測
下載量 2,644
發布時間 : 8/27/2024

模型概述

該模型能夠根據語言指令和多視角RGB圖像預測未來64個機器人動作,兼容多種現代移動機械臂系統

模型特點

多模態輸入支持
同時處理語言指令和多達三個視角的RGB圖像輸入
通用機器人兼容性
支持單臂/雙臂、關節/末端執行器空間、位置/速度控制等多種機器人平臺
大規模預訓練
基於100萬+機器人操作數據和46個公開數據集訓練
長序列動作預測
能夠預測未來64個連續機器人動作

模型能力

視覺語言理解
機器人動作序列預測
多視角圖像處理
跨平臺機器人控制

使用案例

工業自動化
裝配線操作
根據語言指令完成零件抓取和裝配任務
實現精確的連續動作控制
服務機器人
家庭物品整理
根據語音指令識別和整理家居物品
完成複雜的多步驟操作序列
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase