D

Dqn MountainCar V0

由sb3開發
這是一個使用stable-baselines3訓練的DQN智能體模型,專門用於解決MountainCar-v0環境中的強化學習任務。
下載量 578
發布時間 : 5/19/2022

模型概述

該模型基於深度Q網絡(DQN)算法,用於解決經典的MountainCar控制問題,目標是讓小車通過擺動爬上山頂。

模型特點

基於深度強化學習
使用深度Q網絡(DQN)算法,結合深度神經網絡和強化學習技術
優化的超參數
經過精心調優的超參數組合,包括學習率、探索率等
穩定訓練框架
基於stable-baselines3和RL Zoo訓練框架,確保訓練穩定性

模型能力

解決連續控制問題
學習最優策略
適應MountainCar環境

使用案例

教育演示
強化學習教學
用於展示深度強化學習算法在經典控制問題中的應用
平均獎勵達到-103.40
算法研究
DQN算法基準測試
作為其他強化學習算法的性能基準
提供可比較的性能指標
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase