O

Octo Base

由rail-berkeley開發
Octo是一個基於擴散策略訓練的機器人控制基礎模型,能夠預測未來動作並處理多模態輸入。
下載量 215
發布時間 : 12/13/2023

模型概述

Octo基礎模型是一個用於機器人控制的Transformer模型,通過處理視覺和語言輸入來預測未來動作。它支持多攝像頭輸入和語言指令,適用於各種機器人操作任務。

模型特點

多模態輸入處理
能夠同時處理來自主攝像頭和腕部攝像頭的視覺輸入,以及語言指令輸入
擴散策略訓練
採用先進的擴散策略進行模型訓練,提高動作預測的準確性
大規模數據集訓練
基於Open X-Embodiment混合數據集訓練,涵蓋26個不同機器人數據集
靈活輸入支持
推理時可輸入任意子集的觀測和任務鍵值,支持最多2個時間步長的歷史窗口

模型能力

視覺數據處理
語言指令理解
多步動作預測
多攝像頭輸入處理
機器人控制

使用案例

工業機器人
裝配線操作
控制工業機械臂完成產品裝配任務
物料搬運
指導機器人完成物品抓取和放置操作
服務機器人
家庭助理
執行日常家務任務如整理物品
餐飲服務
完成食品準備和送餐任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase