P

Ppo PongNoFrameskip V4

由ThomasSimonini開發
這是一個基於stable-baselines3庫訓練的PPO智能體,專門用於玩雅達利遊戲PongNoFrameskip-v4。
下載量 148
發布時間 : 3/2/2022

模型概述

該模型使用PPO算法訓練,能夠在PongNoFrameskip-v4遊戲中作為綠色方與對手對戰,平均獎勵達到21分。

模型特點

高性能遊戲AI
在PongNoFrameskip-v4遊戲中取得平均21分的優秀表現
基於穩定強化學習框架
使用stable-baselines3庫實現,這是一個廣泛認可的強化學習框架
幀堆疊處理
採用4幀堆疊技術處理遊戲畫面,提高模型對動態環境的理解能力

模型能力

雅達利遊戲PongNoFrameskip-v4對戰
強化學習環境交互
即時遊戲決策

使用案例

遊戲AI
Pong遊戲對戰
作為AI玩家與人類或其他AI進行Pong遊戲對戰
平均獎勵21分
強化學習研究
作為強化學習算法研究的基準模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase