SpaceInvadersNoFrameskip-v4-2Mstepsオープンソースゲームインテリジェントエージェント

ホーム

Spaceinvadersnoframeskip V4 2Msteps

bguanによって開発

これはDQNアルゴリズムに基づく強化学習エージェントで、SpaceInvadersNoFrameskip-v4ゲームをプレイするために特別に設計され、stable-baselines3ライブラリでトレーニングされています。

動画処理 #アタリゲーム #深層Q学習 #フレームスタッキング

ダウンロード数 17

リリース時間 : 6/12/2022

モデル概要

このモデルは深層Qネットワーク(DQN)アルゴリズムでトレーニングされており、アタリゲームのSpace Invadersで良好なパフォーマンスを発揮し、平均報酬は約550点です。

モデル特徴

アタリゲーム専用

特にSpace Invadersゲーム向けに最適化されたアタリゲーム環境専用

安定したトレーニングフレームワーク

stable-baselines3ライブラリに基づいて構築され、信頼性の高いトレーニング環境を提供

事前トレーニング済みモデル

トレーニング済みのモデルを提供し、直接ゲームテストに使用可能

モデル能力

アタリゲーム制御

強化学習意思決定

ゲーム状態理解

使用事例

ゲームAI

Space InvadersゲームAI

このモデルをSpace InvadersゲームのAIプレイヤーとして使用

平均報酬約550点

強化学習研究

DQNアルゴリズム性能研究

DQNアルゴリズムのアタリゲーム上での実装事例として

🚀 DQNエージェントによるSpaceInvadersNoFrameskip - v4のプレイ

このモデルは、[stable - baselines3ライブラリ](https://github.com/DLR - RM/stable - baselines3) と [RL Zoo](https://github.com/DLR - RM/rl - baselines3 - zoo) を使用して、SpaceInvadersNoFrameskip - v4をプレイするように学習されたDQNエージェントです。RL Zooは、Stable Baselines3の強化学習エージェントの学習フレームワークで、ハイパーパラメータの最適化と事前学習済みのエージェントが含まれています。

🚀 クイックスタート

このセクションでは、学習済みモデルの使用方法と学習方法について説明します。

✨ 主な機能

DQNエージェント：SpaceInvadersNoFrameskip - v4ゲームをプレイするために学習されたエージェントです。
RL Zooの利用：Stable Baselines3の強化学習エージェントの学習とハイパーパラメータ最適化を支援するフレームワークを使用しています。

📦 インストール

このモデルを使用するには、以下のリポジトリが必要です。

RL Zoo: https://github.com/DLR - RM/rl - baselines3 - zoo
SB3: https://github.com/DLR - RM/stable - baselines3
SB3 Contrib: https://github.com/Stable - Baselines - Team/stable - baselines3 - contrib

モデルのダウンロードと実行

# モデルをダウンロードしてlogs/フォルダに保存
python -m utils.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -orga bguan -f logs/
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/

モデルの学習

python train.py --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
# モデルをアップロードし、可能な場合は動画を生成
python -m utils.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga bguan

💻 使用例

基本的な使用法

# モデルのダウンロードと実行
# Download model and save it into the logs/ folder
python -m utils.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -orga bguan -f logs/
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/

高度な使用法

# モデルの学習とアップロード
# Train the model and upload it (generate video when possible)
python train.py --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
python -m utils.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga bguan

🔧 技術詳細

メトリクス

Property	Details
Model Type	DQN
Training Data	SpaceInvadersNoFrameskip - v4
Mean Reward	550.00 +/- 150.17

ハイパーパラメータ

OrderedDict([('batch_size', 256),
             ('buffer_size', 400000),
             ('env_wrapper',
              ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
             ('exploration_final_eps', 0.01),
             ('exploration_fraction', 0.1),
             ('frame_stack', 4),
             ('gradient_steps', 1),
             ('learning_rate', 0.0001),
             ('learning_starts', 100000),
             ('n_timesteps', 2000000),
             ('optimize_memory_usage', True),
             ('policy', 'CnnPolicy'),
             ('target_update_interval', 1000),
             ('train_freq', 4),
             ('normalize', False)])