D

Decision Transformer Gym Halfcheetah Medium

由edbeeching開發
這是一個基於決策變換器架構的強化學習模型,專門針對Gym HalfCheetah連續控制環境訓練,使用中等質量軌跡數據進行訓練。
下載量 27
發布時間 : 3/16/2022

模型概述

該模型採用決策變換器架構,能夠處理連續控制任務,特別適用於機器人控制和物理模擬環境中的決策問題。

模型特點

軌跡建模能力
能夠有效建模和預測中等質量軌跡數據中的動作序列
連續控制優化
專門針對連續控制任務進行優化,適合機器人控制場景
標準化處理
提供完整的歸一化係數,便於輸入數據的預處理

模型能力

連續動作空間預測
強化學習策略生成
物理模擬環境控制

使用案例

機器人控制
HalfCheetah運動控制
在Gym HalfCheetah環境中實現高效的運動控制
能夠生成有效的控制策略使機器人實現穩定運動
強化學習研究
決策變換器應用研究
作為決策變換器在連續控制任務中的基準模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase