F

Flower Libero 10

由mbreuss開發
FlowerVLA是一個針對機器人操作任務預訓練的視覺-語言-動作流策略模型,訓練數據來自LIBERO 10數據集,僅包含10億參數。
下載量 14
發布時間 : 3/17/2025

模型概述

FlowerVLA採用創新架構,使用Florence-2模型半數參數實現多模態視覺語言編碼,採用基於Transformer的新型流匹配架構,以約10億參數提供高效通用的VLA策略。

模型特點

高效多模態編碼
使用Florence-2模型半數參數實現多模態視覺語言編碼
流匹配架構
採用基於Transformer的新型流匹配架構
高效參數規模
僅包含10億參數,提供高效通用的VLA策略
高性能
在LIBERO 10挑戰賽中取得高成功率

模型能力

視覺語言動作模型
機器人操作任務
多模態編碼
流匹配

使用案例

機器人操作
將物品放入籃子
將字母湯和番茄醬放入籃子
成功率 0.9791666666666666
打開爐灶並放上摩卡壺
廚房場景3_打開爐灶並放上摩卡壺
成功率 0.9791666666666666
將黑碗放入櫥櫃底層抽屜並關閉
廚房場景4_將黑碗放入櫥櫃底層抽屜並關閉
成功率 1.0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase