F

Flower Calvin Abc

由mbreuss開發
FlowerVLA是一個針對機器人操作任務預訓練的視覺-語言-動作模型,基於CALVIN ABC數據集訓練,採用高效的流匹配架構,僅約10億參數。
下載量 20
發布時間 : 3/16/2025

模型概述

FlowerVLA是一種高效的視覺-語言-動作流策略模型,專為機器人操作任務設計,結合多模態視覺-語言編碼和新型Transformer架構。

模型特點

高效的多模態編碼
採用Florence-2模型的一半結構進行多模態視覺-語言編碼,實現高效的視覺-語言融合。
流匹配架構
使用新型基於Transformer的流匹配架構,優化動作生成流程。
輕量化設計
僅約10億參數即可實現高效、通用的視覺-語言-動作策略,適合即時機器人操作。

模型能力

視覺-語言-動作融合
機器人操作任務執行
多模態輸入處理
動作空間預測

使用案例

機器人技術
CALVIN ABC挑戰賽
在CALVIN ABC挑戰賽中執行復雜機器人操作任務
目前排名第一,平均任務完成長度4.54
物體抓取
根據語言指令抓取特定物體
高成功率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase