P

Ppo PongNoFrameskip V4

Developed by ThomasSimonini
這是一個基於stable-baselines3庫訓練的PPO智能體,專門用於玩雅達利遊戲PongNoFrameskip-v4。
Downloads 148
Release Time : 3/2/2022

Model Overview

該模型使用PPO算法訓練,能夠在PongNoFrameskip-v4遊戲中作為綠色方與對手對戰,平均獎勵達到21分。

Model Features

高性能遊戲AI
在PongNoFrameskip-v4遊戲中取得平均21分的優秀表現
基於穩定強化學習框架
使用stable-baselines3庫實現,這是一個廣泛認可的強化學習框架
幀堆疊處理
採用4幀堆疊技術處理遊戲畫面,提高模型對動態環境的理解能力

Model Capabilities

雅達利遊戲PongNoFrameskip-v4對戰
強化學習環境交互
即時遊戲決策

Use Cases

遊戲AI
Pong遊戲對戰
作為AI玩家與人類或其他AI進行Pong遊戲對戰
平均獎勵21分
強化學習研究
作為強化學習算法研究的基準模型
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase