Rdt 170m
RDT-170M是一个拥有1.7亿参数的模仿学习扩散Transformer模型,用于机器人视觉-语言-动作任务。
Downloads 278
Release Time : 10/23/2024
Model Overview
RDT-170M是一个基于Transformer的扩散策略模型,能够根据语言指令和多视角RGB图像预测未来64个机器人动作,兼容多种移动机械臂平台。
Model Features
多模态输入支持
支持语言指令和多达三个视角的RGB图像输入
广泛兼容性
兼容单臂/双臂、关节空间/末端执行器空间、位置控制/速度控制等多种机器人平台
统一动作空间
通过统一动作空间支持多种机器人控制方式
大规模预训练
基于46个机器人数据集进行预训练
Model Capabilities
视觉-语言理解
机器人动作预测
多模态融合
扩散模型推理
Use Cases
机器人控制
移动机械臂控制
根据语言指令和视觉输入控制移动机械臂执行任务
可预测未来64个机器人动作
双臂协调操作
控制双臂机器人完成协调操作任务
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98