P

Ppo SpaceInvadersNoFrameskip V4

由sb3開發
這是一個基於PPO算法的強化學習智能體,專門用於在SpaceInvadersNoFrameskip-v4遊戲環境中進行訓練和遊戲。
下載量 8,999
發布時間 : 6/2/2022

模型概述

該模型使用stable-baselines3庫和RL Zoo框架訓練,能夠在Atari遊戲Space Invaders中實現自動遊戲。

模型特點

高性能遊戲AI
在SpaceInvaders遊戲中實現了886.50 ± 417.30的平均獎勵表現
穩定訓練框架
基於stable-baselines3和RL Zoo訓練框架,提供可靠的訓練過程
專門優化的超參數
針對SpaceInvaders遊戲環境進行了專門的超參數優化

模型能力

Atari遊戲控制
強化學習決策
遊戲狀態理解

使用案例

遊戲AI
Space Invaders遊戲AI
自動玩Space Invaders遊戲
平均獎勵886.50 ± 417.30
強化學習研究
PPO算法研究
研究PPO算法在Atari遊戲中的表現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase