D

Dqn Acrobot V1

由sb3開發
這是一個基於 stable-baselines3 庫訓練的 DQN 強化學習智能體,專門用於解決 Acrobot-v1 控制問題。
下載量 403
發布時間 : 6/2/2022

模型概述

該模型使用深度Q網絡(DQN)算法在Acrobot-v1環境中進行訓練,能夠學習如何控制雙連桿擺系統以達到目標狀態。

模型特點

基於穩定強化學習框架
使用 stable-baselines3 庫實現,這是一個可靠的強化學習框架
優化的超參數配置
經過調優的超參數設置,包括學習率、探索策略等
完整的訓練流程支持
可通過 RL Zoo 框架進行訓練、評估和部署

模型能力

強化學習控制
連續動作空間處理
環境狀態感知

使用案例

學術研究
強化學習算法比較
可作為基準模型與其他強化學習算法在Acrobot環境中的表現進行比較
平均獎勵-72.10 ±6.44
教育演示
強化學習教學案例
用於展示DQN算法在控制問題中的應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase