D

Decision Transformer Gym Hopper Medium

edbeechingによって開発
これはGym Hopper環境で中程度のパフォーマンス軌跡を使用して訓練された意思決定トランスフォーマーモデルで、連続制御タスクに適しています。
ダウンロード数 6,518
リリース時間 : 3/16/2022

モデル概要

このモデルは意思決定トランスフォーマーアーキテクチャに基づいており、Gym Hopper環境の連続制御タスク向けに特別に訓練されており、環境状態に応じて適切な動作決定を生成できます。

モデル特徴

軌跡ベースの意思決定生成
モデルは中程度のパフォーマンス軌跡を学習することで意思決定を生成し、連続制御タスクに適用できます。
状態正規化
詳細な正規化係数を提供し、入力状態が正しく処理されることを保証します。
強化学習アプリケーション
強化学習環境向けに設計されており、特にGym Hopperなどの連続制御タスクに適しています。

モデル能力

連続行動空間での意思決定
強化学習環境制御
軌跡学習

使用事例

ロボット制御
Hopperロボットの運動制御
Hopperロボットのジャンプとバランスを制御
中程度の運動性能を実現
強化学習研究
意思決定トランスフォーマーアルゴリズムの検証
連続制御タスクにおける意思決定トランスフォーマーの性能を検証するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase