O

Openvla 7b Oft Finetuned Libero Goal

moojinkによって開発
OpenVLA-OFTは最適化された視覚 - 言語 - 動作モデルで、微調整技術により基礎となるOpenVLAモデルの性能と速度を大幅に向上させています。
ダウンロード数 579
リリース時間 : 2/25/2025

モデル概要

このモデルは視覚、言語、動作生成能力を結合し、ロボットタスクに特化して最適化されており、視覚入力とタスク説明に基づいて連続した動作シーケンスを生成することができます。

モデル特徴

最適化された微調整技術
OFT(Optimized Fine - Tuning)技術を採用し、基礎モデルに比べて著しい性能向上が見られます
マルチモーダル入力処理
視覚画像、言語説明、自己知覚状態入力を同時に処理することができます
連続動作生成
MLP動作ヘッドにより連続したロボット動作シーケンスを生成します

モデル能力

視覚 - 言語理解
連続動作予測
ロボットタスク実行
マルチモーダルデータ融合

使用事例

ロボット制御
空間タスク実行
視覚入力とタスク説明に基づいて空間操作タスクを完了します
LIBERO - Goalタスクで基礎モデルよりも優れた性能を発揮します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase