T

Testpushblock

rebolforcesによって開発
PPOアルゴリズムに基づいてトレーニングされた深層強化学習エージェントで、UnityのPushBlockゲーム環境用
ダウンロード数 30
リリース時間 : 8/20/2022

モデル概要

このモデルはUnity ML-Agentsフレームワークでトレーニングされ、PushBlock環境における物体押しタスクの解決に特化しており、ゲームAIにおける強化学習の応用例を示しています

モデル特徴

PPOアルゴリズムベース
Proximal Policy Optimizationという安定した強化学習アルゴリズムを使用してトレーニング
Unity環境統合
Unity ML-AgentsのPushBlock環境専用に設計されており、Unityに直接デプロイ可能
継続的トレーニングサポート
mlagents-learnコマンドを通じてモデルの継続的トレーニングをサポート

モデル能力

ゲーム環境における意思決定
物体押しタスクの解決
強化学習ポリシーの実行

使用事例

ゲームAI
PushBlockゲームAI
PushBlock環境で物体押しタスクを自動的に完了
ブラウザデモでエージェントのパフォーマンスを観察可能
強化学習研究
PPOアルゴリズム検証
シンプルな3D環境におけるPPOアルゴリズムの実装例として
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase