F

Flower Calvin Abcd

由mbreuss開發
FlowerVLA是一個針對CALVIN ABCD數據集預訓練的機器人操作模型,採用創新的視覺-語言-動作流策略,僅包含10億參數,專為機器人學習設計。
下載量 24
發布時間 : 3/16/2025

模型概述

FlowerVLA是一種高效的視覺-語言-動作流策略,採用半量Florence-2進行多模態視覺-語言編碼,結合基於Transformer的新型流匹配架構,實現高效、通用的視覺-語言-動作策略。

模型特點

高效的多模態編碼
使用半量Florence-2進行多模態視覺-語言編碼,實現高效的視覺-語言-動作策略。
創新的流匹配架構
採用基於Transformer的新型流匹配架構,僅約10億參數即可實現高效、通用的視覺-語言-動作策略。
高性能
在CALVIN ABCD挑戰賽中排名第一,平均長度達到4.72。

模型能力

視覺-語言-動作編碼
機器人操作
多模態任務執行

使用案例

機器人技術
拾取物體
根據語言指令拾取特定物體,如藍色立方體。
在測試中達到99.1%的成功率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase