O

Octo Small 1.5

由rail-berkeley開發
Octo小型版是一個用於機器人控制的擴散策略模型,採用Transformer架構,能夠根據視覺輸入和語言指令預測機器人動作。
下載量 250
發布時間 : 5/21/2024

模型概述

該模型是一個2700萬參數的Transformer架構,專為機器人控制任務設計。它通過處理視覺輸入(主攝像頭和腕部攝像頭圖像)和語言指令,預測未來4步的7維動作。模型採用擴散策略訓練,窗口大小為2。

模型特點

多模態輸入處理
能夠同時處理視覺輸入(攝像頭圖像)和語言指令
擴散策略
採用擴散策略進行訓練,能夠預測未來4步的7維動作
輕量級架構
2700萬參數的Transformer架構,適合即時機器人控制
廣泛的數據集訓練
基於Open X-Embodiment混合數據集訓練,包含25個不同機器人數據集

模型能力

視覺-語言多模態處理
機器人動作預測
即時控制
多任務學習

使用案例

機器人控制
基於視覺的物體抓取
根據攝像頭輸入和語言指令控制機器人抓取特定物體
桌面操作任務
執行桌面環境中的各種操作任務,如推、拉、旋轉等
工業自動化
裝配線操作
在工業環境中執行精確的裝配任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase