O

Octo Small

rail-berkeleyによって開発
Octo小型版は拡散戦略で訓練されたロボット制御モデルで、将来4ステップの7次元動作を予測可能。多様なロボットデータセットに適用可能。
ダウンロード数 335
リリース時間 : 12/13/2023

モデル概要

このモデルはTransformerアーキテクチャを採用し、軽量な畳み込みエンコーダで画像データを前処理し、T5言語エンコーダと組み合わせてテキスト指令を処理し、ロボット動作予測と制御に使用されます。

モデル特徴

多様データ訓練
25の異なるロボットデータセットからの訓練データを統合し、幅広いロボット操作シナリオをカバー
軽量アーキテクチャ
2700万パラメータのコンパクトなTransformerアーキテクチャを採用し、リアルタイムロボット制御に適している
マルチモーダル入力
メインカメラと手首カメラの画像入力をサポートし、言語指令と組み合わせて動作予測を行う
拡散戦略
拡散戦略を使用して訓練され、将来4ステップの7次元動作を予測可能

モデル能力

ロボット動作予測
マルチモーダルデータ処理
リアルタイム制御
言語指令理解

使用事例

産業用ロボット
組立ライン操作
視覚入力と言語指令に基づき製品組立タスクを完了
サービスロボット
物品把持
ユーザー指令に基づき指定物品を識別・把持
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase