D

Dqn CartPole V1

由sb3開發
這是一個基於深度Q網絡(DQN)的強化學習模型,專門用於解決CartPole-v1環境中的平衡杆問題。
下載量 35
發布時間 : 6/2/2022

模型概述

該模型使用stable-baselines3庫實現,能夠在CartPole-v1環境中穩定保持杆子平衡,達到最高獎勵500分。

模型特點

高性能平衡控制
在CartPole-v1環境中實現了完美的500分平均獎勵
優化的超參數
使用精心調優的超參數組合,確保訓練效率和穩定性
雙網絡架構
採用DQN的標準實現,包含目標網絡和經驗回放機制

模型能力

強化學習控制
連續動作空間處理
平衡控制

使用案例

教育演示
強化學習教學示例
用於展示強化學習基本原理和DQN算法的工作方式
直觀展示智能體如何學習保持杆子平衡
算法基準測試
強化學習算法比較
作為其他強化學習算法在CartPole環境中的性能基準
提供500分的完美表現作為參考標準
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase