T

Testpyramidsrnd

由reachrkr開發
這是一個基於PPO算法的強化學習智能體,專門訓練用於在Unity ML-Agents的金字塔環境中執行任務。
下載量 59
發布時間 : 7/28/2022

模型概述

該模型使用PPO(Proximal Policy Optimization)算法在Unity的ML-Agents金字塔環境中進行訓練,能夠在該3D環境中完成特定的導航或任務解決。

模型特點

Unity環境集成
專為Unity ML-Agents金字塔環境設計,可與Unity3D無縫集成
PPO算法實現
採用Proximal Policy Optimization算法,平衡探索與利用
3D導航能力
能夠在複雜的3D金字塔環境中進行有效導航

模型能力

3D環境導航
強化學習決策
Unity環境交互

使用案例

遊戲AI
智能NPC控制
在遊戲環境中控制NPC完成特定任務
NPC能夠自主導航並完成任務
機器人模擬
虛擬機器人訓練
在虛擬環境中訓練機器人導航能力
為真實世界機器人部署提供預訓練模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase