R

Rdt 170m

robotics-diffusion-transformerによって開発
RDT-170Mは1.7億パラメータを持つ模倣学習拡散Transformerモデルで、ロボットの視覚-言語-動作タスクに使用されます。
ダウンロード数 278
リリース時間 : 10/23/2024

モデル概要

RDT-170MはTransformerベースの拡散戦略モデルで、言語指令とマルチビューRGB画像から未来64のロボット動作を予測し、様々な移動ロボットアームプラットフォームと互換性があります。

モデル特徴

マルチモーダル入力サポート
言語指令と最大3ビューのRGB画像入力をサポート
広範な互換性
単腕/両腕、関節空間/エンドエフェクタ空間、位置制御/速度制御など様々なロボットプラットフォームと互換
統一動作空間
統一動作空間により複数のロボット制御方式をサポート
大規模事前学習
46のロボットデータセットに基づく事前学習

モデル能力

視覚-言語理解
ロボット動作予測
マルチモーダル融合
拡散モデル推論

使用事例

ロボット制御
移動ロボットアーム制御
言語指令と視覚入力に基づき移動ロボットアームを制御してタスクを実行
未来64のロボット動作を予測可能
両腕協調操作
両腕ロボットを制御して協調操作タスクを完了
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase