O

Openvla 7b Oft Finetuned Libero Spatial Object Goal 10

Developed by moojink
OpenVLA-OFT是基於OpenVLA模型優化的視覺-語言-動作模型,通過微調技術在LIBERO任務套件上顯著提升了執行速度和成功率。
Downloads 447
Release Time : 4/28/2025

Model Overview

該模型專注於機器人任務執行,通過視覺和語言輸入生成連續動作序列,適用於空間、物體、目標和長期任務場景。

Model Features

優化的微調技術
採用OFT(Optimized Fine-Tuning)技術顯著提升基礎模型的執行速度和任務成功率
多任務支持
在LIBERO任務套件的四個子集(Spatial、Object、Goal、Long)上進行了專門優化
多模態輸入
支持視覺(主相機和腕部相機圖像)、語言(任務描述)和本體感受狀態的多模態輸入

Model Capabilities

視覺-語言理解
連續動作序列生成
機器人任務執行
多模態信息融合

Use Cases

機器人控制
空間導航任務
根據視覺輸入和任務描述完成空間導航和物體操作
在LIBERO-Spatial任務上表現優異
長期任務執行
執行需要多步驟規劃的長期機器人任務
在LIBERO-Long任務上表現良好
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase