T

Testpyramidsrnd

由RaphaelReinauer開發
這是一個基於PPO算法的強化學習智能體,專門為Unity的ML-Agents金字塔環境訓練而成。
下載量 21
發布時間 : 7/15/2022

模型概述

該模型使用PPO(近端策略優化)算法在Unity的ML-Agents金字塔環境中進行訓練,能夠在該3D環境中導航並完成任務。

模型特點

Unity環境集成
專為Unity的ML-Agents金字塔環境設計,可與Unity無縫集成
PPO算法
採用近端策略優化算法,平衡探索與利用
3D導航能力
能夠在複雜3D金字塔環境中導航並完成任務

模型能力

3D環境導航
強化學習決策
Unity環境交互

使用案例

遊戲AI
自動導航
在3D遊戲環境中自動尋找路徑
能夠完成金字塔環境中的導航任務
機器人仿真
虛擬機器人訓練
用於訓練虛擬機器人在複雜環境中的移動能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase