T

Testpushblock

由rebolforces開發
一個基於PPO算法訓練的深度強化學習智能體,用於Unity的PushBlock遊戲環境
下載量 30
發布時間 : 8/20/2022

模型概述

該模型使用Unity ML-Agents框架訓練,專門用於解決PushBlock環境中的物體推動任務,展示了強化學習在遊戲AI中的應用

模型特點

基於PPO算法
使用Proximal Policy Optimization這一穩定的強化學習算法進行訓練
Unity環境集成
專為Unity ML-Agents的PushBlock環境設計,可直接在Unity中部署
持續訓練支持
支持通過mlagents-learn命令繼續訓練模型

模型能力

遊戲環境中的決策制定
物體推動任務解決
強化學習策略執行

使用案例

遊戲AI
PushBlock遊戲AI
在PushBlock環境中自動完成物體推動任務
可觀察智能體在瀏覽器演示中的表現
強化學習研究
PPO算法驗證
作為PPO算法在簡單3D環境中的實現案例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase