T

Testpyramidsrnd

由Aitor開發
這是一個基於PPO算法的強化學習智能體,專門訓練用於在Unity的ML-Agents金字塔環境中進行導航和任務解決。
下載量 15
發布時間 : 10/27/2022

模型概述

該模型使用近端策略優化(PPO)算法訓練,能夠在Unity ML-Agents的金字塔環境中自主學習和執行任務。

模型特點

Unity環境集成
專為Unity ML-Agents金字塔環境設計,可直接在3D虛擬環境中運行
PPO算法
採用近端策略優化算法,平衡探索與利用,實現穩定學習
即時可視化
支持在瀏覽器中即時觀看智能體在環境中的表現

模型能力

3D環境導航
障礙物避讓
目標導向行為
強化學習決策

使用案例

遊戲AI
自動尋路
智能體可在複雜3D環境中自主尋找路徑
任務解決
能夠完成金字塔環境中的特定任務
教育演示
強化學習教學
可作為強化學習算法的教學案例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase