O

Octo Small

由rail-berkeley開發
Octo小型版是一個基於擴散策略訓練的機器人控制模型,能夠預測未來4步的7維動作,適用於多源機器人數據集。
下載量 335
發布時間 : 12/13/2023

模型概述

該模型採用Transformer架構,通過輕量級卷積編碼器預處理圖像數據,並結合T5語言編碼器處理文本指令,用於機器人動作預測和控制。

模型特點

多源數據訓練
整合了來自25個不同機器人數據集的訓練數據,覆蓋廣泛的機器人操作場景
輕量級架構
採用2700萬參數的緊湊Transformer架構,適合即時機器人控制
多模態輸入
支持主攝像頭和腕部攝像頭圖像輸入,結合語言指令進行動作預測
擴散策略
使用擴散策略進行訓練,能夠預測未來4步的7維動作

模型能力

機器人動作預測
多模態數據處理
即時控制
語言指令理解

使用案例

工業機器人
裝配線操作
根據視覺輸入和語言指令完成產品裝配任務
服務機器人
物品抓取
根據用戶指令識別並抓取指定物品
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase