D

Dqn BeamRiderNoFrameskip V4

Developed by sb3
これはDQNアルゴリズムに基づく強化学習モデルで、アタリゲームBeamRiderNoFrameskip-v4環境専用に設計されています。
Downloads 169
Release Time : 6/2/2022

Model Overview

このモデルは深層Qネットワーク(DQN)アルゴリズムでトレーニングされ、BeamRiderゲーム環境でインテリジェントな意思決定を実現し、平均報酬は4777ポイントに達します。

Model Features

アタリゲーム専用
アタリゲーム環境BeamRiderNoFrameskip-v4に特化して最適化トレーニング
安定したトレーニング
stable-baselines3ライブラリを使用し、トレーニングプロセスが安定で信頼性が高い
効率的な学習
経験再生やターゲットネットワークなどの技術で学習効率を向上

Model Capabilities

ゲーム意思決定
強化学習
アタリゲーム制御

Use Cases

ゲームAI
BeamRiderゲームAI
BeamRiderゲームで自動ゲーム制御を実現
平均報酬4777.20ポイント
強化学習研究
DQNアルゴリズム研究
DQNアルゴリズム研究のベンチマークモデルとして使用可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase