S

Sac Walker2d V3

由sb3開發
這是一個基於SAC算法的強化學習模型,專為Walker2d-v3環境設計,能夠控制雙足機器人行走。
下載量 43
發布時間 : 6/2/2022

模型概述

該模型使用stable-baselines3庫中的SAC算法訓練,用於解決Walker2d-v3環境中的連續控制任務,實現雙足機器人的穩定行走。

模型特點

高效連續控制
使用SAC算法優化連續動作空間的控制策略
穩定訓練
模型在訓練過程中表現出穩定的學習曲線
RL Zoo集成
與RL Zoo訓練框架無縫集成,便於超參數優化和模型共享

模型能力

雙足機器人控制
連續動作空間優化
強化學習策略訓練

使用案例

機器人控制
雙足機器人行走
控制雙足機器人在仿真環境中實現穩定行走
平均獎勵達到3876.28 +/- 75.51
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase