M

Mlagents Crawler

由infinitejoy開發
這是一個使用Unity ML-Agents庫訓練的PPO智能體模型,專門用於Crawler環境中的強化學習任務。
下載量 21
發布時間 : 7/16/2022

模型概述

該模型是基於PPO(Proximal Policy Optimization)算法訓練的強化學習智能體,用於控制Crawler環境中的多足機器人運動。

模型特點

基於PPO算法
使用Proximal Policy Optimization算法訓練,這是一種穩定高效的強化學習算法。
Unity ML-Agents集成
完全兼容Unity ML-Agents庫,可以輕鬆部署到Unity環境中。
多足機器人控制
專門用於控制Crawler環境中的複雜多足機器人運動。

模型能力

多足機器人運動控制
強化學習決策
連續動作空間處理

使用案例

機器人控制
多足機器人行走
控制多足機器人在複雜環境中穩定行走
模型可以學習有效的步態策略
強化學習研究
作為PPO算法的基準測試環境
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase