P

Pushblock

mrm8488によって開発
これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのPushBlock環境でタスクを完了するために特別にトレーニングされています。
ダウンロード数 35
リリース時間 : 8/7/2022

モデル概要

このモデルはUnity ML-Agentsライブラリを使用してトレーニングされ、PushBlock環境で箱を押す戦略を学習できます。

モデル特徴

PPOアルゴリズムベース
Proximal Policy Optimizationアルゴリズムを使用してトレーニングされており、これは先進的な強化学習アルゴリズムです。
Unity環境統合
UnityのML-Agents環境向けに特別に設計されており、Unityプロジェクトにシームレスに統合できます。
視覚的デモンストレーション
ブラウザで直接エージェントのゲームプレイを視聴できます。

モデル能力

箱押しタスク
強化学習意思決定
Unity環境インタラクション

使用事例

ゲームAI
箱押しゲームAI
箱押し系ゲームのAI対戦相手やデモキャラクターとして使用可能です。
基本的な箱押しタスクを完了できます
教育デモ
強化学習教育
単純な環境におけるPPOアルゴリズムの応用例を展示するのに使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase