U

Unitypyramidsrnd

由jakka開發
這是一個基於PPO算法的強化學習智能體,專門為Unity的ML-Agents金字塔環境訓練而成。
下載量 15
發布時間 : 7/24/2022

模型概述

該模型使用PPO(近端策略優化)算法在Unity的ML-Agents金字塔環境中進行訓練,能夠在該環境中執行特定任務。

模型特點

Unity環境集成
專為Unity ML-Agents金字塔環境設計,可直接在Unity中部署使用
PPO算法
採用近端策略優化算法,平衡探索與利用,實現穩定的策略學習
可視化演示
支持通過Hugging Face Spaces直接觀看智能體在環境中的表現

模型能力

環境導航
任務執行
強化學習決策

使用案例

遊戲AI
金字塔環境導航
智能體在金字塔迷宮中尋找路徑完成任務
可觀察智能體在環境中的決策過程
強化學習研究
PPO算法演示
作為PPO算法在3D環境中的應用案例
可用於教學或算法比較
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase