O

Octo Small

Developed by rail-berkeley
Octo小型版是一个基于扩散策略训练的机器人控制模型,能够预测未来4步的7维动作,适用于多源机器人数据集。
Downloads 335
Release Time : 12/13/2023

Model Overview

该模型采用Transformer架构,通过轻量级卷积编码器预处理图像数据,并结合T5语言编码器处理文本指令,用于机器人动作预测和控制。

Model Features

多源数据训练
整合了来自25个不同机器人数据集的训练数据,覆盖广泛的机器人操作场景
轻量级架构
采用2700万参数的紧凑Transformer架构,适合实时机器人控制
多模态输入
支持主摄像头和腕部摄像头图像输入,结合语言指令进行动作预测
扩散策略
使用扩散策略进行训练,能够预测未来4步的7维动作

Model Capabilities

机器人动作预测
多模态数据处理
实时控制
语言指令理解

Use Cases

工业机器人
装配线操作
根据视觉输入和语言指令完成产品装配任务
服务机器人
物品抓取
根据用户指令识别并抓取指定物品
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase