P

Ppo SeaquestNoFrameskip V4

ThomasSimoniniによって開発
これはstable-baselines3ライブラリを使用して訓練されたPPOエージェントモデルで、アタリゲームのSeaquestNoFrameskip-v4をプレイするために特別に開発されています。
ダウンロード数 205
リリース時間 : 3/2/2022

モデル概要

このモデルはPPOアルゴリズムに基づいて訓練され、Seaquestゲームで高いスコアを達成することができます。モデルはCNNポリシーを使用してゲーム画面を処理し、強化学習によってゲーム戦略を不断に最適化します。

モデル特徴

高性能ゲームAI
Seaquestゲームで平均1820点を獲得し、優れた性能を発揮します。
安定した訓練フレームワーク
stable-baselines3ライブラリに基づいて開発され、訓練プロセスは安定して信頼性が高いです。
フレームスタック処理
4フレームスタック技術を使用してゲーム画面を処理し、モデルの動的環境への理解を向上させます。

モデル能力

アタリゲーム制御
強化学習による意思決定
ゲーム画面理解

使用事例

ゲームAI
Seaquestゲームの自動プレイヤー
モデルは自動的にSeaquestゲームをプレイし、高いスコアを達成することができます。
平均報酬1820点
強化学習研究
PPOアルゴリズムのベンチマークテスト
アタリゲームにおけるPPOアルゴリズムの性能ベンチマークとして使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase