D

Dqn BeamRiderNoFrameskip V4

sb3によって開発
これはDQNアルゴリズムに基づく強化学習モデルで、アタリゲームBeamRiderNoFrameskip-v4環境専用に設計されています。
ダウンロード数 169
リリース時間 : 6/2/2022

モデル概要

このモデルは深層Qネットワーク(DQN)アルゴリズムでトレーニングされ、BeamRiderゲーム環境でインテリジェントな意思決定を実現し、平均報酬は4777ポイントに達します。

モデル特徴

アタリゲーム専用
アタリゲーム環境BeamRiderNoFrameskip-v4に特化して最適化トレーニング
安定したトレーニング
stable-baselines3ライブラリを使用し、トレーニングプロセスが安定で信頼性が高い
効率的な学習
経験再生やターゲットネットワークなどの技術で学習効率を向上

モデル能力

ゲーム意思決定
強化学習
アタリゲーム制御

使用事例

ゲームAI
BeamRiderゲームAI
BeamRiderゲームで自動ゲーム制御を実現
平均報酬4777.20ポイント
強化学習研究
DQNアルゴリズム研究
DQNアルゴリズム研究のベンチマークモデルとして使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase