Mlagents PushBlock
這是一個使用 Unity ML-Agents 庫訓練的 PPO 智能體模型,專門用於 PushBlock 遊戲環境。
下載量 53
發布時間 : 7/4/2022
模型概述
該模型是基於 PPO (Proximal Policy Optimization) 算法的強化學習智能體,經過訓練可以在 Unity 的 PushBlock 環境中執行推方塊任務。
模型特點
基於 PPO 算法
使用 Proximal Policy Optimization 算法進行訓練,這是一種先進的強化學習算法。
Unity 環境集成
專為 Unity 的 ML-Agents 框架設計,可直接在 Unity 環境中部署和運行。
可視化演示
支持通過 Hugging Face Spaces 直接在瀏覽器中觀看智能體的表現。
模型能力
推方塊任務執行
強化學習決策
Unity 環境交互
使用案例
遊戲 AI
PushBlock 遊戲 AI
作為 PushBlock 遊戲中的智能體,能夠學習並執行推方塊的任務。
經過訓練的智能體能夠有效地完成推方塊的目標。
強化學習研究
PPO 算法應用
可作為研究 PPO 算法在 Unity 環境中表現的案例。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98