MLAgents-PushBlock開源模型 - 免費部署助力智能體玩轉PushBlock遊戲

首頁

Mlagents PushBlock

由kingabzpro開發

這是一個使用 Unity ML-Agents 庫訓練的 PPO 智能體模型，專門用於 PushBlock 遊戲環境。

分子模型

TensorBoard

#Unity強化學習 #推塊遊戲AI #PPO算法

下載量 53

發布時間 : 7/4/2022

模型概述

該模型是基於 PPO (Proximal Policy Optimization) 算法的強化學習智能體，經過訓練可以在 Unity 的 PushBlock 環境中執行推方塊任務。

模型特點

基於 PPO 算法

使用 Proximal Policy Optimization 算法進行訓練，這是一種先進的強化學習算法。

Unity 環境集成

專為 Unity 的 ML-Agents 框架設計，可直接在 Unity 環境中部署和運行。

可視化演示

支持通過 Hugging Face Spaces 直接在瀏覽器中觀看智能體的表現。

模型能力

推方塊任務執行

強化學習決策

Unity 環境交互

使用案例

遊戲 AI

PushBlock 遊戲 AI

作為 PushBlock 遊戲中的智能體，能夠學習並執行推方塊的任務。

經過訓練的智能體能夠有效地完成推方塊的目標。

強化學習研究

PPO 算法應用

可作為研究 PPO 算法在 Unity 環境中表現的案例。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Mlagents PushBlock

模型概述

模型特點

模型能力

使用案例

🚀 ppo 智能體玩 PushBlock

🚀 快速開始

🔧 使用（搭配 ML-Agents）

🔄 恢復訓練

👀 觀看智能體遊戲