D

Dqn LunarLander V2

araffinによって開発
これはstable-baselines3ライブラリでトレーニングされたDQNエージェントで、LunarLander-v2環境における強化学習タスクを解決するためのものです。
ダウンロード数 54
リリース時間 : 5/5/2022

モデル概要

このモデルは深層Qネットワーク(DQN)アルゴリズムに基づいており、LunarLander-v2環境における着陸制御問題を解決するために特別に設計されています。

モデル特徴

安定したトレーニング
stable-baselines3ライブラリを使用して実装されており、安定したトレーニングプロセスと信頼性の高いパフォーマンスを提供します
効率的な探索
最適化された探索戦略を採用し、40,000タイムステップ以内に探索を完了します
2層ネットワークアーキテクチャ
256x256の2層ニューラルネットワーク構造を使用し、モデル容量とトレーニング効率のバランスを取っています

モデル能力

強化学習
連続制御
環境インタラクション
意思決定

使用事例

ゲームAI
月面着陸機制御
仮想月面着陸機を指定領域に安全に着陸させる
平均報酬280.22±13.03
教育デモ
強化学習教育用サンプル
深層強化学習の教育事例として
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase