P

Ppo Pushblock 9M

rebolforcesによって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-AgentsのPushBlockゲームタスクを解決するために特別に訓練されました。
ダウンロード数 19
リリース時間 : 8/21/2022

モデル概要

このモデルはPPO(近接方策最適化)アルゴリズムで訓練されており、PushBlock環境で効果的にブロックを目標位置に押し出すことができます。

モデル特徴

PPOアルゴリズムベース
近接方策最適化アルゴリズムを使用しており、安定かつ効率的な強化学習アルゴリズムです
900万ステップ訓練
モデルは900万ステップの十分な訓練を受けており、PushBlockタスクで良好なパフォーマンスを発揮します
Unity統合
Unity環境に直接展開して実行可能

モデル能力

PushBlockゲームタスクの解決
ブロックを目標位置に押し出す学習
Unity物理環境への適応

使用事例

ゲームAI
PushBlockゲームソリューション
PushBlockゲームのAIソリューションとして
安定してブロックを目標位置に押し出すことが可能
強化学習研究
PPOアルゴリズムデモ
Unity環境におけるPPOアルゴリズムの実装事例として
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase