P

Ppo PongNoFrameskip V4

ThomasSimoniniによって開発
これはstable-baselines3ライブラリでトレーニングされたPPOエージェントで、アタリゲームPongNoFrameskip-v4をプレイするために特別に設計されています。
ダウンロード数 148
リリース時間 : 3/2/2022

モデル概要

このモデルはPPOアルゴリズムでトレーニングされており、PongNoFrameskip-v4ゲームで緑側として対戦相手と戦い、平均報酬21点を達成します。

モデル特徴

高性能ゲームAI
PongNoFrameskip-v4ゲームで平均21点の優れたパフォーマンスを発揮
安定した強化学習フレームワークベース
広く認知されている強化学習フレームワークであるstable-baselines3ライブラリを使用
フレームスタッキング処理
4フレームスタッキング技術を採用し、ゲーム画面を処理することで、モデルの動的環境理解能力を向上

モデル能力

アタリゲームPongNoFrameskip-v4対戦
強化学習環境とのインタラクション
リアルタイムゲーム意思決定

使用事例

ゲームAI
Pongゲーム対戦
AIプレイヤーとして人間や他のAIとPongゲームで対戦
平均報酬21点
強化学習研究
強化学習アルゴリズム研究のベンチマークモデルとして
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase