T

Testpyramidsrnd

Aitorによって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境でのナビゲーションとタスク解決のために特別に訓練されています。
ダウンロード数 15
リリース時間 : 10/27/2022

モデル概要

このモデルは近接方策最適化(PPO)アルゴリズムを使用して訓練され、Unity ML-Agentsのピラミッド環境で自律的に学習しタスクを実行できます。

モデル特徴

Unity環境統合
Unity ML-Agentsピラミッド環境専用設計で、3D仮想環境で直接動作可能
PPOアルゴリズム
近接方策最適化アルゴリズムを採用し、探索と活用のバランスを取り安定した学習を実現
リアルタイム可視化
ブラウザでエージェントの環境内でのパフォーマンスをリアルタイムで観察可能

モデル能力

3D環境ナビゲーション
障害物回避
目標指向行動
強化学習意思決定

使用事例

ゲームAI
自動経路探索
エージェントは複雑な3D環境で自律的に経路を見つけることが可能
タスク解決
ピラミッド環境内の特定タスクを完了可能
教育デモ
強化学習教育
強化学習アルゴリズムの教育事例として利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase