F

Flower Calvin Abcd

mbreussによって開発
FlowerVLAはCALVIN ABCDデータセット向けに事前学習されたロボット操作モデルで、革新的な視覚-言語-動作フロー戦略を採用し、わずか10億パラメータでロボット学習に特化しています。
ダウンロード数 24
リリース時間 : 3/16/2025

モデル概要

FlowerVLAは効率的な視覚-言語-動作フロー戦略で、半量のFlorence-2を使用したマルチモーダル視覚-言語エンコーディングと、Transformerベースの新しいフローマッチングアーキテクチャを組み合わせ、効率的で汎用的な視覚-言語-動作戦略を実現します。

モデル特徴

効率的なマルチモーダルエンコーディング
半量のFlorence-2を使用したマルチモーダル視覚-言語エンコーディングにより、効率的な視覚-言語-動作戦略を実現。
革新的なフローマッチングアーキテクチャ
Transformerベースの新しいフローマッチングアーキテクチャを採用し、わずか約10億パラメータで効率的で汎用的な視覚-言語-動作戦略を実現。
高性能
CALVIN ABCDチャレンジで1位を獲得し、平均長4.72を達成。

モデル能力

視覚-言語-動作エンコーディング
ロボット操作
マルチモーダルタスク実行

使用事例

ロボット技術
物体のピックアップ
言語指示に基づいて特定の物体(青い立方体など)を拾い上げる。
テストで99.1%の成功率を達成。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase