Pyramidsrndオープンソースゲーム決定モデル - 無料でピラミッド環境で簡単にゲームを決定できます

ホーム

Pyramidsrnd

mrm8488によって開発

これはUnity ML-AgentsライブラリでトレーニングされたPPOエージェントモデルで、ピラミッド環境でのゲームと意思決定に特化しています。

物体検出

TensorBoard

#UnityゲームAI #深層強化学習 #PPOアルゴリズム

ダウンロード数 25

リリース時間 : 8/1/2022

モデル概要

このモデルはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境でゲームと意思決定を行うようにトレーニングされています。

モデル特徴

PPOアルゴリズムベース

Proximal Policy Optimizationアルゴリズムを使用してトレーニングされており、これは先進的な強化学習アルゴリズムです。

Unity環境統合

Unity ML-Agentsピラミッド環境専用に設計されており、Unityゲームエンジンとシームレスに統合できます。

トレーニング再開可能

コマンドライン引数を通じてトレーニングプロセスを再開できるため、モデル性能の継続的な最適化が容易です。

モデル能力

環境認識

ゲーム意思決定

経路計画

目標指向行動

使用事例

ゲームAI

ピラミッド環境ナビゲーション

エージェントがピラミッド環境をナビゲートしタスクを完了する

環境内でのエージェントの意思決定経路と効率を観察可能

強化学習教育

強化学習アルゴリズムの教育例として

PPOアルゴリズムの実環境での応用効果を展示

Property	Details
Tags	unity-ml-agents, ml-agents, deep-reinforcement-learning, reinforcement-learning, ML-Agents-Pyramids
Library Name	ml-agents

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Pyramidsrnd

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ppoエージェントがピラミッドをプレイする

🚀 クイックスタート

📦 インストール

学習の再開

エージェントのプレイを見る