T

Testpyramidsrnd

由rebolforces開發
這是一個基於PPO算法的強化學習智能體,專門訓練用於在Unity的ML-Agents金字塔環境中導航和完成任務。
下載量 65
發布時間 : 8/20/2022

模型概述

該模型使用近端策略優化(PPO)算法在Unity ML-Agents的金字塔環境中進行訓練,能夠學習在複雜3D環境中導航和解決任務。

模型特點

金字塔環境適應
專門針對Unity ML-Agents的金字塔3D環境進行優化訓練
PPO算法實現
採用近端策略優化算法,平衡探索與利用,實現穩定學習
即時演示支持
可通過Hugging Face Spaces進行即時可視化演示

模型能力

3D環境導航
障礙物避讓
目標導向行為
強化學習決策

使用案例

遊戲AI
NPC智能導航
用於遊戲中NPC在複雜3D環境中的自主導航
機器人仿真
機器人路徑規劃
模擬機器人在複雜環境中的導航能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase