U

Unitypyramidsrnd

jakkaによって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境向けにトレーニングされています。
ダウンロード数 15
リリース時間 : 7/24/2022

モデル概要

このモデルはPPO(近接方策最適化)アルゴリズムを使用し、UnityのML-Agentsピラミッド環境でトレーニングされ、特定のタスクを実行できます。

モデル特徴

Unity環境統合
Unity ML-Agentsピラミッド環境専用に設計されており、Unityで直接デプロイ可能
PPOアルゴリズム
近接方策最適化アルゴリズムを採用し、探索と活用のバランスを取り、安定した方策学習を実現
可視化デモ
Hugging Face Spacesを通じてエージェントの環境内でのパフォーマンスを直接視聴可能

モデル能力

環境ナビゲーション
タスク実行
強化学習意思決定

使用事例

ゲームAI
ピラミッド環境ナビゲーション
エージェントがピラミッド迷路で経路を見つけタスクを完了
環境内でのエージェントの意思決定プロセスを観察可能
強化学習研究
PPOアルゴリズムデモ
3D環境におけるPPOアルゴリズムの応用例として
教育やアルゴリズム比較に使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase