F

Flower Libero 10

mbreussによって開発
FlowerVLAはロボット操作タスク向けに事前学習された視覚-言語-動作フロー戦略モデルで、LIBERO 10データセットから訓練され、わずか10億パラメータを含みます。
ダウンロード数 14
リリース時間 : 3/17/2025

モデル概要

FlowerVLAは革新的なアーキテクチャを採用し、Florence-2モデルの半分のパラメータでマルチモーダル視覚言語エンコーディングを実現し、Transformerベースの新しいフローマッチングアーキテクチャを使用し、約10億パラメータで効率的で汎用的なVLA戦略を提供します。

モデル特徴

効率的なマルチモーダルエンコーディング
Florence-2モデルの半分のパラメータでマルチモーダル視覚言語エンコーディングを実現
フローマッチングアーキテクチャ
Transformerベースの新しいフローマッチングアーキテクチャを採用
効率的なパラメータ規模
わずか10億パラメータを含み、効率的で汎用的なVLA戦略を提供
高性能
LIBERO 10チャレンジで高い成功率を達成

モデル能力

視覚言語動作モデル
ロボット操作タスク
マルチモーダルエンコーディング
フローマッチング

使用事例

ロボット操作
アイテムをバスケットに入れる
アルファベットスープとトマトケチャップをバスケットに入れる
成功率 0.9791666666666666
コンロを開けてモカポットを置く
キッチンシーン3_コンロを開けてモカポットを置く
成功率 0.9791666666666666
黒いボウルをキャビネットの下段引き出しに入れて閉める
キッチンシーン4_黒いボウルをキャビネットの下段引き出しに入れて閉める
成功率 1.0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase