R

Rdt 170m

Developed by robotics-diffusion-transformer
RDT-170M是一个拥有1.7亿参数的模仿学习扩散Transformer模型,用于机器人视觉-语言-动作任务。
Downloads 278
Release Time : 10/23/2024

Model Overview

RDT-170M是一个基于Transformer的扩散策略模型,能够根据语言指令和多视角RGB图像预测未来64个机器人动作,兼容多种移动机械臂平台。

Model Features

多模态输入支持
支持语言指令和多达三个视角的RGB图像输入
广泛兼容性
兼容单臂/双臂、关节空间/末端执行器空间、位置控制/速度控制等多种机器人平台
统一动作空间
通过统一动作空间支持多种机器人控制方式
大规模预训练
基于46个机器人数据集进行预训练

Model Capabilities

视觉-语言理解
机器人动作预测
多模态融合
扩散模型推理

Use Cases

机器人控制
移动机械臂控制
根据语言指令和视觉输入控制移动机械臂执行任务
可预测未来64个机器人动作
双臂协调操作
控制双臂机器人完成协调操作任务
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase