D

Dqn Acrobot V1

sb3によって開発
これはstable-baselines3ライブラリでトレーニングされたDQN強化学習エージェントで、Acrobot-v1制御問題を解決するために特別に設計されています。
ダウンロード数 403
リリース時間 : 6/2/2022

モデル概要

このモデルは深層Qネットワーク(DQN)アルゴリズムを使用してAcrobot-v1環境でトレーニングされ、二重リンク振り子システムを制御して目標状態に達する方法を学習できます。

モデル特徴

安定した強化学習フレームワークベース
信頼性の高い強化学習フレームワークであるstable-baselines3ライブラリを使用して実装
最適化されたハイパーパラメータ設定
学習率、探索戦略などを含む調整済みのハイパーパラメータ設定
完全なトレーニングプロセスサポート
RL Zooフレームワークを通じてトレーニング、評価、デプロイが可能

モデル能力

強化学習制御
連続行動空間処理
環境状態認識

使用事例

学術研究
強化学習アルゴリズム比較
Acrobot環境における他の強化学習アルゴリズムとの性能比較のベンチマークモデルとして使用可能
平均報酬-72.10 ±6.44
教育デモ
強化学習教育事例
制御問題におけるDQNアルゴリズムの応用を展示するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase