P

Ppo Pushblock 9M

由rebolforces開發
這是一個基於PPO算法的強化學習智能體,專門訓練用於解決Unity ML-Agents中的PushBlock遊戲任務。
下載量 19
發布時間 : 8/21/2022

模型概述

該模型使用PPO(近端策略優化)算法訓練,能夠在PushBlock環境中有效地推動方塊到目標位置。

模型特點

基於PPO算法
使用近端策略優化算法,這是一種穩定且高效的強化學習算法
900萬步訓練
模型經過了900萬步的充分訓練,在PushBlock任務上表現良好
Unity集成
可以直接在Unity環境中部署和運行

模型能力

解決PushBlock遊戲任務
學習推動方塊到目標位置
適應Unity物理環境

使用案例

遊戲AI
PushBlock遊戲解決方案
作為PushBlock遊戲的AI解決方案
能夠穩定地將方塊推到目標位置
強化學習研究
PPO算法演示
作為PPO算法在Unity環境中的實現案例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase