T

Testpyramidsrnd

AdiKompellaによって開発
これはPPOアルゴリズムを使用してUnity ML-Agentsのピラミッド環境でトレーニングされた強化学習エージェントモデルです
ダウンロード数 15
リリース時間 : 7/13/2022

モデル概要

このモデルはPPO(近接方策最適化)アルゴリズムに基づいており、Unity ML-Agentsのピラミッド環境向けに特別にトレーニングされており、その環境で特定の強化学習タスクを実行できます

モデル特徴

Unity ML-Agents互換
このモデルはUnity ML-Agentsフレームワークと完全に互換性があり、Unity環境に直接デプロイして実行できます
PPOアルゴリズム実装
先進的な強化学習アルゴリズムである近接方策最適化(PPO)を採用してトレーニングされています
ピラミッド環境専用
Unityのピラミッド環境向けに特別にトレーニングされており、その環境で優れたパフォーマンスを発揮します

モデル能力

環境ナビゲーション
意思決定
強化学習タスク実行

使用事例

ゲームAI
ピラミッド環境ナビゲーション
Unityのピラミッド環境で自律的にナビゲーションと意思決定を行う
ピラミッド環境の特定タスクを完了できる
強化学習研究
PPOアルゴリズム応用
Unity環境におけるPPOアルゴリズムの応用例として利用可能
3D環境におけるPPOアルゴリズムの性能を展示
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase