T

Testpyramidsrnd

Mahmoud7によって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境向けに特別にトレーニングされています。
ダウンロード数 16
リリース時間 : 8/11/2022

モデル概要

このモデルはPPO(近位方策最適化)アルゴリズムを使用し、UnityのML-Agentsピラミッド環境でトレーニングされ、特定のナビゲーションやタスク解決目標を達成できます。

モデル特徴

Unity環境統合
Unity ML-Agentsピラミッド環境専用設計で、Unityに直接デプロイして実行可能
PPOアルゴリズム
近位方策最適化アルゴリズムを採用し、探索と活用のバランスを取り、安定した方策学習を実現
リアルタイムデモ
Hugging Face Spacesを通じてリアルタイムデモを視聴可能

モデル能力

環境ナビゲーション
タスク解決
強化学習意思決定

使用事例

ゲームAI
ピラミッド環境ナビゲーション
エージェントがピラミッド迷路をナビゲートしタスクを完了
環境内でのエージェントの意思決定経路を観察可能
教育デモ
強化学習教育
PPOアルゴリズムの実環境での応用を展示
強化学習トレーニング効果を直観的に展示
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase