P

Ppo SeaquestNoFrameskip V4

由ThomasSimonini開發
這是一個使用stable-baselines3庫訓練的PPO智能體模型,專門用於玩雅達利遊戲SeaquestNoFrameskip-v4。
下載量 205
發布時間 : 3/2/2022

模型概述

該模型基於PPO算法訓練,能夠在Seaquest遊戲中取得較高分數。模型使用CNN策略處理遊戲畫面,並通過強化學習不斷優化遊戲策略。

模型特點

高性能遊戲AI
在Seaquest遊戲中平均獲得1820分,表現優異
穩定訓練框架
基於stable-baselines3庫開發,訓練過程穩定可靠
幀堆疊處理
使用4幀堆疊技術處理遊戲畫面,提升模型對動態環境的理解

模型能力

雅達利遊戲控制
強化學習決策
遊戲畫面理解

使用案例

遊戲AI
Seaquest遊戲自動玩家
模型可以自動玩Seaquest遊戲並取得高分
平均獎勵1820分
強化學習研究
PPO算法基準測試
可作為PPO算法在雅達利遊戲上的性能基準
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase