T

Testpyramidsrnd

curt-tiggesによって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境向けに特別にトレーニングされています。
ダウンロード数 49
リリース時間 : 9/5/2022

モデル概要

このモデルはPPO(Proximal Policy Optimization)アルゴリズムを使用し、UnityのML-Agentsピラミッド環境でトレーニングされており、この環境で特定の強化学習タスクを実行できます。

モデル特徴

PPOアルゴリズムベース
Proximal Policy Optimizationアルゴリズムを使用してトレーニングされており、これは先進的な強化学習アルゴリズムです。
Unity ML-Agents統合
Unity ML-Agentsフレームワーク向けに設計されており、Unity環境にシームレスに統合できます。
ピラミッド環境適応
ピラミッド環境に特化してトレーニングおよび最適化されています。

モデル能力

ピラミッド環境ナビゲーション
強化学習タスク実行
Unity環境インタラクション

使用事例

ゲームAI
ピラミッド環境ナビゲーション
エージェントはピラミッド環境内でナビゲーションや探索が可能です。
強化学習研究
PPOアルゴリズム検証
3D環境におけるPPOアルゴリズムの性能検証に使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase