D

Decision Transformer Gym Halfcheetah Expert

edbeechingによって開発
これはGym HalfCheetah環境からサンプリングされた専門家軌跡で訓練された意思決定トランスフォーマーモデルです。
ダウンロード数 98
リリース時間 : 3/16/2022

モデル概要

このモデルは意思決定トランスフォーマーアーキテクチャを使用し、Gym HalfCheetah環境の連続制御タスク専用に設計されており、環境状態に基づいて最適な動作を予測できます。

モデル特徴

専門家軌跡訓練
モデルはGym HalfCheetah環境からサンプリングされた専門家軌跡で訓練され、専門家の戦略を学習できます。
状態正規化
詳細な正規化係数(平均と標準偏差)を提供し、入力状態が正しく処理されることを保証します。
シーケンシャル意思決定
Transformerアーキテクチャに基づき、履歴状態情報を考慮したシーケンシャル意思決定問題を処理できます。

モデル能力

連続動作空間制御
強化学習戦略予測
ロボット制御シミュレーション

使用事例

ロボット制御
HalfCheetahシミュレーション制御
Gym HalfCheetah環境で効率的な運動制御を実現
専門家戦略を学習し、専門家に類似した制御効果を実現できます
強化学習研究
意思決定トランスフォーマー応用研究
連続制御タスクにおける意思決定トランスフォーマーの応用例として
Mujoco環境における意思決定トランスフォーマーの有効性を検証
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase