T

Testpyramidsrnd

SusBioRes-UBCによって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境でのナビゲーションとタスク完了のために特別に訓練されています。
ダウンロード数 16
リリース時間 : 7/10/2022

モデル概要

このモデルは、UnityのML-Agentsフレームワークで近位方策最適化(PPO)アルゴリズムを使用して訓練され、ピラミッド環境におけるナビゲーションと意思決定タスクの解決を目的としています。

モデル特徴

PPOアルゴリズムベース
近位方策最適化という先進的な強化学習アルゴリズムを使用して訓練され、探索と活用のバランスを取ります
Unity環境統合
Unity ML-Agentsのピラミッド環境専用に設計されており、Unityプロジェクトにシームレスに統合できます
継続学習能力
--resumeパラメータを使用して訓練を再開でき、モデルの継続的な改善を実現します

モデル能力

環境ナビゲーション
経路計画
意思決定
強化学習

使用事例

ゲームAI
インテリジェントNPCナビゲーション
ゲーム環境内でNPCにインテリジェントなナビゲーション能力を提供します
NPCは自律的に経路を見つけてタスクを完了できます
ロボットシミュレーション
ロボット経路計画
シミュレーションロボットに環境探索と経路計画の能力を提供します
ロボットは複雑な環境で効果的にナビゲートできます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase