T

Testpyramidsrnd

由SusBioRes-UBC開發
這是一個基於PPO算法的強化學習智能體,專門訓練用於在Unity ML-Agents的金字塔環境中導航和完成任務。
下載量 16
發布時間 : 7/10/2022

模型概述

該模型使用近端策略優化(PPO)算法在Unity的ML-Agents框架中訓練,旨在解決金字塔環境中的導航和決策任務。

模型特點

基於PPO算法
使用近端策略優化這一先進的強化學習算法進行訓練,平衡探索與利用
Unity環境集成
專門為Unity ML-Agents的金字塔環境設計,可無縫集成到Unity項目中
持續學習能力
支持通過--resume參數恢復訓練,實現模型的持續改進

模型能力

環境導航
路徑規劃
決策制定
強化學習

使用案例

遊戲AI
智能NPC導航
在遊戲環境中為NPC提供智能導航能力
NPC能夠自主尋找路徑並完成任務
機器人仿真
機器人路徑規劃
為仿真機器人提供環境探索和路徑規劃能力
機器人能夠在複雜環境中有效導航
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase