T

Testpyramidsrnd

mariastullによって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境向けに特別にトレーニングされています。
ダウンロード数 22
リリース時間 : 7/11/2022

モデル概要

このモデルはPPO(近接方策最適化)アルゴリズムを使用してトレーニングされ、UnityのML-Agentsピラミッド環境でナビゲーションや目標達成タスクを実行できます。

モデル特徴

Unity環境統合
Unity ML-Agentsピラミッド環境専用に設計されており、Unityシミュレーターで直接実行可能
PPOアルゴリズム
近接方策最適化アルゴリズムを採用し、探索と活用のバランスを取り、安定したトレーニングを実現
可視化デモ
Hugging Face Spacesを通じてエージェントの動作パフォーマンスを直接視聴可能

モデル能力

3D環境ナビゲーション
目標認識と達成
強化学習意思決定

使用事例

ゲームAI
ピラミッド探索AI
エージェントがピラミッド環境で自律的に探索しタスクを完了
複雑な3D環境におけるエージェントの意思決定プロセスを観察可能
強化学習教育
PPOアルゴリズムデモ
3D環境におけるPPOアルゴリズムの実践的な応用を展示
強化学習トレーニングプロセスの直感的な理解
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase